মেটা লামা 4 প্রকাশ করেছে, ফ্ল্যাগশিপ এআই মডেলের একটি নতুন ফসল

[ad_1]

মেটা আছে এআই মডেলগুলির একটি নতুন সংগ্রহ প্রকাশ করেছেলামা 4, এর লামা পরিবারে – শনিবার, কম নয়।

মোট চারটি নতুন মডেল রয়েছে: লামা 4 স্কাউট, লামা 4 ম্যাভেরিক এবং লামা 4 বেহেমথ। মেটা বলে, “বিস্তৃত ভিজ্যুয়াল বোঝাপড়া” দেওয়ার জন্য সকলকে “প্রচুর পরিমাণে লেবেলযুক্ত পাঠ্য, চিত্র এবং ভিডিও ডেটা” তে প্রশিক্ষণ দেওয়া হয়েছিল।

চাইনিজ এআই ল্যাব ডিপসেকের ওপেন মডেলের সাফল্য, যা মেটার আগের ফ্ল্যাগশিপ লামা মডেলগুলির চেয়ে সমান বা আরও ভাল পারফর্ম করে, ল্লামা বিকাশকে ওভারড্রাইভে লাথি মেরেছে বলে জানা গেছে। কথিত আছে যে ডিপিসিক আর 1 এবং ভি 3 এর মতো মডেলগুলি চালানো এবং মোতায়েনের ব্যয়কে কীভাবে কমিয়ে দিয়েছে তা বোঝার জন্য মেটা স্ক্র্যাম্বলড ওয়ার রুম রয়েছে।

স্কাউট এবং ম্যাভেরিক প্রকাশ্যে উপলভ্য Llama.com এবং এআই দেব প্ল্যাটফর্ম আলিঙ্গন মুখ সহ মেটার অংশীদারদের কাছ থেকে, যখন বেহেমথ এখনও প্রশিক্ষণে রয়েছেন। মেটা বলেছে যে হোয়াটসঅ্যাপ, ম্যাসেঞ্জার এবং ইনস্টাগ্রাম সহ অ্যাপ্লিকেশনগুলিতে এর এআই-চালিত সহকারী মেটা এআই 40 টি দেশে লামা 4 ব্যবহার করার জন্য আপডেট করা হয়েছে। মাল্টিমোডাল বৈশিষ্ট্যগুলি আপাতত ইংরেজিতে সীমাবদ্ধ।

কিছু বিকাশকারী লামা 4 লাইসেন্স নিয়ে ইস্যু নিতে পারে।

ব্যবহারকারী এবং সংস্থাগুলি “আবাসস্থল” বা ইইউতে একটি “ব্যবসায়ের মূল স্থান” সহ মডেলগুলি ব্যবহার বা বিতরণ করা নিষিদ্ধসম্ভবত এই অঞ্চলের এআই এবং ডেটা গোপনীয়তা আইন দ্বারা আরোপিত প্রশাসনের প্রয়োজনীয়তার ফলাফল। (অতীতে, মেটা এই আইনগুলিকে অত্যধিক বোঝা হিসাবে চিহ্নিত করেছে।) এ ছাড়াও, পূর্ববর্তী লামা প্রকাশের মতো, million০০ মিলিয়নেরও বেশি মাসিক সক্রিয় ব্যবহারকারীদের সংস্থাগুলি অবশ্যই মেটা থেকে একটি বিশেষ লাইসেন্সের জন্য অনুরোধ করতে হবে, যা মেটা তার নিজস্ব বিবেচনার ভিত্তিতে মঞ্জুর বা অস্বীকার করতে পারে।

“এই লামা 4 মডেলগুলি লামা ইকোসিস্টেমের জন্য একটি নতুন যুগের সূচনা চিহ্নিত করে,” মেটা একটি ব্লগ পোস্টে লিখেছেন। “এটি লামা 4 সংগ্রহের জন্য কেবল শুরু” ”

মেটা বলেছে যে লামা 4 হ’ল বিশেষজ্ঞদের মিশ্রণ (এমওই) আর্কিটেকচার ব্যবহার করার জন্য এটি প্রথম মডেলগুলির সমাহার, যা প্রশিক্ষণের জন্য এবং প্রশ্নের উত্তর দেওয়ার জন্য আরও গণনামূলকভাবে দক্ষ। এমওই আর্কিটেকচারগুলি মূলত ডেটা প্রসেসিং কার্যগুলি সাবটাস্কগুলিতে ভেঙে দেয় এবং তারপরে এগুলি ছোট, বিশেষ “বিশেষজ্ঞ” মডেলগুলিতে প্রতিনিধিত্ব করে।

উদাহরণস্বরূপ, ম্যাভেরিকের 400 বিলিয়ন মোট পরামিতি রয়েছে তবে কেবল 17 বিলিয়ন সক্রিয় 128 জুড়ে প্যারামিটারগুলি “বিশেষজ্ঞ।” (প্যারামিটারগুলি মোটামুটি কোনও মডেলের সমস্যা সমাধানের দক্ষতার সাথে সামঞ্জস্য করে)) স্কাউটে 17 বিলিয়ন সক্রিয় পরামিতি, 16 বিশেষজ্ঞ এবং 109 বিলিয়ন মোট পরামিতি রয়েছে।

মেটার অভ্যন্তরীণ পরীক্ষার মতে, ম্যাভেরিক, যা সংস্থাটি বলেছে যে “সাধারণ সহকারী এবং চ্যাট” এর জন্য সৃজনশীল লেখার মতো কেসগুলি ব্যবহার করা ভাল, নির্দিষ্ট কোডিং, যুক্তি, বহুভাষিক, দীর্ঘ-প্রসঙ্গ এবং চিত্রের বেঞ্চমার্কগুলিতে ওপেনাইয়ের জিপিটি -4o এবং গুগলের জেমিনি 2.0 এর মতো মডেলগুলি ছাড়িয়ে যায়। যাইহোক, ম্যাভেরিক গুগলের জেমিনি 2.5 প্রো, নৃতাত্ত্বিক ক্লোড 3.7 সনেট এবং ওপেনএআইয়ের জিপিটি -4.5 এর মতো আরও সক্ষম সাম্প্রতিক মডেলগুলিকে পুরোপুরি পরিমাপ করে না।

স্কাউটের শক্তিগুলি ডকুমেন্টের সংক্ষিপ্তকরণ এবং বৃহত কোডবেসগুলির উপর যুক্তির মতো কার্যগুলিতে থাকে। অনন্যভাবে, এটির একটি খুব বড় প্রসঙ্গ উইন্ডো রয়েছে: 10 মিলিয়ন টোকেন। (“টোকেনগুলি” কাঁচা পাঠ্যের বিটগুলি উপস্থাপন করে – যেমন “ফ্যান্টাস্টিক” শব্দটি “ফ্যান,” “টিএএস” এবং “টিক।” তে বিভক্ত) প্লেইন ইংলিশে স্কাউট চিত্রগুলি এবং কয়েক মিলিয়ন শব্দ পর্যন্ত নিতে পারে, এটি প্রক্রিয়া করতে এবং অত্যন্ত দীর্ঘ নথির সাথে কাজ করতে দেয়।

স্কাউট একটি একক এনভিডিয়া এইচ 100 জিপিইউতে চলতে পারে, যখন ম্যাভেরিকের একটি এনভিডিয়া এইচ 100 ডিজিএক্স সিস্টেম বা সমতুল্য প্রয়োজন, মেটার গণনা অনুসারে।

মেটার অপ্রকাশিত বেহেমথের এমনকি বিফিয়ার হার্ডওয়্যারও প্রয়োজন। সংস্থার মতে, বেহেমথের ২৮৮ বিলিয়ন সক্রিয় পরামিতি, ১ 16 জন বিশেষজ্ঞ এবং প্রায় দুই ট্রিলিয়ন মোট পরামিতি রয়েছে। মেটার অভ্যন্তরীণ বেঞ্চমার্কিংয়ের ফলে গণিতের সমস্যা সমাধানের মতো স্টেম দক্ষতা পরিমাপের বিভিন্ন মূল্যায়নের উপর জিপিটি -৪.৫, ক্লড ৩.7 সনেট এবং জেমিনি ২.০ প্রো (তবে ২.৫ প্রো নয়) ছাড় রয়েছে।

লক্ষণীয় বিষয়, লামা 4 মডেলগুলির কোনওটিই ওপেনাইয়ের O1 এবং O3-mini এর লাইনে একটি সঠিক “যুক্তি” মডেল নয়। যুক্তিযুক্ত মডেলগুলি তাদের উত্তরগুলি-যাচাই করে এবং সাধারণত আরও নির্ভরযোগ্যভাবে প্রশ্নগুলিতে প্রতিক্রিয়া জানায় তবে ফলস্বরূপ উত্তরগুলি সরবরাহ করতে traditional তিহ্যবাহী, “অ-রিসনিং” মডেলের চেয়ে বেশি সময় লাগে।

মজার বিষয় হল, মেটা বলেছে যে এটি প্রায়শই “বিতর্কিত” প্রশ্নের উত্তর দিতে অস্বীকার করার জন্য এর সমস্ত লামা 4 মডেলকে সুর করেছে। সংস্থাটির মতে, লামা 4 রাজনৈতিক ও সামাজিক বিষয়গুলিকে “বিতর্কিত” প্রতিক্রিয়া জানায় যে লামা মডেলগুলির আগের ফসলটি না। তদতিরিক্ত, সংস্থাটি বলেছে, লামা 4 হ’ল “নাটকীয়ভাবে আরও সুষম” যার সাহায্যে এটি ফ্ল্যাট-আউট বিনোদন দেয় না।

“[Y]আপনি গণনা করতে পারেন [Lllama 4] রায় ছাড়াই সহায়ক, বাস্তব প্রতিক্রিয়া সরবরাহ করার জন্য, “মেটা মুখপাত্র টেকক্রাঞ্চকে বলেছেন।”[W]লামাকে আরও প্রতিক্রিয়াশীল করে তোলা চালিয়ে যাচ্ছে যাতে এটি আরও প্রশ্নের উত্তর দেয়, বিভিন্ন বিভিন্ন দৃষ্টিভঙ্গির প্রতিক্রিয়া জানাতে পারে […] এবং অন্যের উপর কিছু মতামতের পক্ষে নয়। “

হোয়াইট হাউসের কিছু মিত্ররা এআই চ্যাটবটকে খুব রাজনৈতিকভাবে “জেগে” বলে অভিযুক্ত করার সাথে সাথে এই টুইটগুলি আসে।

বিলিয়নেয়ার ইলন মাস্ক এবং ক্রিপ্টো এবং এআই “সিজার” ডেভিড স্যাকস সহ অনেক রাষ্ট্রপতি ডোনাল্ড ট্রাম্পের ঘনিষ্ঠ বিশ্বাসী অভিযোগ করেছেন যে জনপ্রিয় এআই চ্যাটবটস সেন্সর রক্ষণশীল মতামত। বস্তা histor তিহাসিকভাবে আছে এককভাবে আউট ওপেনাইয়ের চ্যাটজিপ্ট হিসাবে “জাগ্রত হওয়ার জন্য প্রোগ্রাম করা হয়েছে” এবং রাজনৈতিক বিষয় সম্পর্কে অবিশ্বস্ত।

বাস্তবে, এআই -তে পক্ষপাত একটি জটিল প্রযুক্তিগত সমস্যা। কস্তুরের নিজস্ব এআই সংস্থা জাই, এমন একটি চ্যাটবট তৈরি করতে লড়াই করেছে যা অন্যের উপর কিছু রাজনৈতিক দৃষ্টিভঙ্গি সমর্থন করে না।

এটি ওপেনাই সহ সংস্থাগুলি তাদের এআই মডেলগুলিকে সামঞ্জস্য করা থেকে বিরত রাখেনি যা তাদের আগের তুলনায় আরও প্রশ্নের উত্তর দেওয়ার জন্য, বিতর্কিত বিষয় সম্পর্কিত বিশেষ প্রশ্নে।

[ad_2]