মেটা লামা 4 প্রকাশ করেছে, ফ্ল্যাগশিপ এআই মডেলের একটি নতুন ফসল

[ad_1]

মেটা আছে এআই মডেলগুলির একটি নতুন সংগ্রহ প্রকাশ করেছেলামা 4, এর লামা পরিবারে – শনিবার, কম নয়।

মোট চারটি নতুন মডেল রয়েছে: লামা 4 স্কাউট, লামা 4 ম্যাভেরিক এবং লামা 4 বেহেমথ। মেটা বলে, “বিস্তৃত ভিজ্যুয়াল বোঝাপড়া” দেওয়ার জন্য সকলকে “প্রচুর পরিমাণে লেবেলযুক্ত পাঠ্য, চিত্র এবং ভিডিও ডেটা” তে প্রশিক্ষণ দেওয়া হয়েছিল।

চাইনিজ এআই ল্যাব ডিপসেকের ওপেন মডেলের সাফল্য, যা মেটার আগের ফ্ল্যাগশিপ লামা মডেলগুলির চেয়ে সমান বা আরও ভাল পারফর্ম করে, ল্লামা বিকাশকে ওভারড্রাইভে লাথি মেরেছে বলে জানা গেছে। কথিত আছে যে ডিপিসিক আর 1 এবং ভি 3 এর মতো মডেলগুলি চালানো এবং মোতায়েনের ব্যয়কে কীভাবে কমিয়ে দিয়েছে তা বোঝার জন্য মেটা স্ক্র্যাম্বলড ওয়ার রুম রয়েছে।

স্কাউট এবং ম্যাভেরিক প্রকাশ্যে উপলভ্য Llama.com এবং এআই দেব প্ল্যাটফর্ম আলিঙ্গন মুখ সহ মেটার অংশীদারদের কাছ থেকে, যখন বেহেমথ এখনও প্রশিক্ষণে রয়েছেন। মেটা বলেছে যে হোয়াটসঅ্যাপ, ম্যাসেঞ্জার এবং ইনস্টাগ্রাম সহ অ্যাপ্লিকেশনগুলিতে এর এআই-চালিত সহকারী মেটা এআই 40 টি দেশে লামা 4 ব্যবহার করার জন্য আপডেট করা হয়েছে। মাল্টিমোডাল বৈশিষ্ট্যগুলি আপাতত ইংরেজিতে সীমাবদ্ধ।

কিছু বিকাশকারী লামা 4 লাইসেন্স নিয়ে ইস্যু নিতে পারে।

ব্যবহারকারী এবং সংস্থাগুলি “আবাসস্থল” বা ইইউতে একটি “ব্যবসায়ের মূল স্থান” সহ মডেলগুলি ব্যবহার বা বিতরণ করা নিষিদ্ধসম্ভবত এই অঞ্চলের এআই এবং ডেটা গোপনীয়তা আইন দ্বারা আরোপিত প্রশাসনের প্রয়োজনীয়তার ফলাফল। (অতীতে, মেটা এই আইনগুলিকে অত্যধিক বোঝা হিসাবে চিহ্নিত করেছে।) এ ছাড়াও, পূর্ববর্তী লামা প্রকাশের মতো, million০০ মিলিয়নেরও বেশি মাসিক সক্রিয় ব্যবহারকারীদের সংস্থাগুলি অবশ্যই মেটা থেকে একটি বিশেষ লাইসেন্সের জন্য অনুরোধ করতে হবে, যা মেটা তার নিজস্ব বিবেচনার ভিত্তিতে মঞ্জুর বা অস্বীকার করতে পারে।

“এই লামা 4 মডেলগুলি লামা ইকোসিস্টেমের জন্য একটি নতুন যুগের সূচনা চিহ্নিত করে,” মেটা একটি ব্লগ পোস্টে লিখেছেন। “এটি লামা 4 সংগ্রহের জন্য কেবল শুরু” ”

মেটা লামা 4
চিত্রের ক্রেডিট:মেটা

মেটা বলেছে যে লামা 4 হ’ল বিশেষজ্ঞদের মিশ্রণ (এমওই) আর্কিটেকচার ব্যবহার করার জন্য এটি প্রথম মডেলগুলির সমাহার, যা প্রশিক্ষণের জন্য এবং প্রশ্নের উত্তর দেওয়ার জন্য আরও গণনামূলকভাবে দক্ষ। এমওই আর্কিটেকচারগুলি মূলত ডেটা প্রসেসিং কার্যগুলি সাবটাস্কগুলিতে ভেঙে দেয় এবং তারপরে এগুলি ছোট, বিশেষ “বিশেষজ্ঞ” মডেলগুলিতে প্রতিনিধিত্ব করে।

উদাহরণস্বরূপ, ম্যাভেরিকের 400 বিলিয়ন মোট পরামিতি রয়েছে তবে কেবল 17 বিলিয়ন সক্রিয় 128 জুড়ে প্যারামিটারগুলি “বিশেষজ্ঞ।” (প্যারামিটারগুলি মোটামুটি কোনও মডেলের সমস্যা সমাধানের দক্ষতার সাথে সামঞ্জস্য করে)) স্কাউটে 17 বিলিয়ন সক্রিয় পরামিতি, 16 বিশেষজ্ঞ এবং 109 বিলিয়ন মোট পরামিতি রয়েছে।

মেটার অভ্যন্তরীণ পরীক্ষার মতে, ম্যাভেরিক, যা সংস্থাটি বলেছে যে “সাধারণ সহকারী এবং চ্যাট” এর জন্য সৃজনশীল লেখার মতো কেসগুলি ব্যবহার করা ভাল, নির্দিষ্ট কোডিং, যুক্তি, বহুভাষিক, দীর্ঘ-প্রসঙ্গ এবং চিত্রের বেঞ্চমার্কগুলিতে ওপেনাইয়ের জিপিটি -4o এবং গুগলের জেমিনি 2.0 এর মতো মডেলগুলি ছাড়িয়ে যায়। যাইহোক, ম্যাভেরিক গুগলের জেমিনি 2.5 প্রো, নৃতাত্ত্বিক ক্লোড 3.7 সনেট এবং ওপেনএআইয়ের জিপিটি -4.5 এর মতো আরও সক্ষম সাম্প্রতিক মডেলগুলিকে পুরোপুরি পরিমাপ করে না।

স্কাউটের শক্তিগুলি ডকুমেন্টের সংক্ষিপ্তকরণ এবং বৃহত কোডবেসগুলির উপর যুক্তির মতো কার্যগুলিতে থাকে। অনন্যভাবে, এটির একটি খুব বড় প্রসঙ্গ উইন্ডো রয়েছে: 10 মিলিয়ন টোকেন। (“টোকেনগুলি” কাঁচা পাঠ্যের বিটগুলি উপস্থাপন করে – যেমন “ফ্যান্টাস্টিক” শব্দটি “ফ্যান,” “টিএএস” এবং “টিক।” তে বিভক্ত) প্লেইন ইংলিশে স্কাউট চিত্রগুলি এবং কয়েক মিলিয়ন শব্দ পর্যন্ত নিতে পারে, এটি প্রক্রিয়া করতে এবং অত্যন্ত দীর্ঘ নথির সাথে কাজ করতে দেয়।

স্কাউট একটি একক এনভিডিয়া এইচ 100 জিপিইউতে চলতে পারে, যখন ম্যাভেরিকের একটি এনভিডিয়া এইচ 100 ডিজিএক্স সিস্টেম বা সমতুল্য প্রয়োজন, মেটার গণনা অনুসারে।

মেটার অপ্রকাশিত বেহেমথের এমনকি বিফিয়ার হার্ডওয়্যারও প্রয়োজন। সংস্থার মতে, বেহেমথের ২৮৮ বিলিয়ন সক্রিয় পরামিতি, ১ 16 জন বিশেষজ্ঞ এবং প্রায় দুই ট্রিলিয়ন মোট পরামিতি রয়েছে। মেটার অভ্যন্তরীণ বেঞ্চমার্কিংয়ের ফলে গণিতের সমস্যা সমাধানের মতো স্টেম দক্ষতা পরিমাপের বিভিন্ন মূল্যায়নের উপর জিপিটি -৪.৫, ক্লড ৩.7 সনেট এবং জেমিনি ২.০ প্রো (তবে ২.৫ প্রো নয়) ছাড় রয়েছে।

লক্ষণীয় বিষয়, লামা 4 মডেলগুলির কোনওটিই ওপেনাইয়ের O1 এবং O3-mini এর লাইনে একটি সঠিক “যুক্তি” মডেল নয়। যুক্তিযুক্ত মডেলগুলি তাদের উত্তরগুলি-যাচাই করে এবং সাধারণত আরও নির্ভরযোগ্যভাবে প্রশ্নগুলিতে প্রতিক্রিয়া জানায় তবে ফলস্বরূপ উত্তরগুলি সরবরাহ করতে traditional তিহ্যবাহী, “অ-রিসনিং” মডেলের চেয়ে বেশি সময় লাগে।

মেটা লামা 4
চিত্রের ক্রেডিট:মেটা

মজার বিষয় হল, মেটা বলেছে যে এটি প্রায়শই “বিতর্কিত” প্রশ্নের উত্তর দিতে অস্বীকার করার জন্য এর সমস্ত লামা 4 মডেলকে সুর করেছে। সংস্থাটির মতে, লামা 4 রাজনৈতিক ও সামাজিক বিষয়গুলিকে “বিতর্কিত” প্রতিক্রিয়া জানায় যে লামা মডেলগুলির আগের ফসলটি না। তদতিরিক্ত, সংস্থাটি বলেছে, লামা 4 হ’ল “নাটকীয়ভাবে আরও সুষম” যার সাহায্যে এটি ফ্ল্যাট-আউট বিনোদন দেয় না।

“[Y]আপনি গণনা করতে পারেন [Lllama 4] রায় ছাড়াই সহায়ক, বাস্তব প্রতিক্রিয়া সরবরাহ করার জন্য, “মেটা মুখপাত্র টেকক্রাঞ্চকে বলেছেন।”[W]লামাকে আরও প্রতিক্রিয়াশীল করে তোলা চালিয়ে যাচ্ছে যাতে এটি আরও প্রশ্নের উত্তর দেয়, বিভিন্ন বিভিন্ন দৃষ্টিভঙ্গির প্রতিক্রিয়া জানাতে পারে […] এবং অন্যের উপর কিছু মতামতের পক্ষে নয়। “

হোয়াইট হাউসের কিছু মিত্ররা এআই চ্যাটবটকে খুব রাজনৈতিকভাবে “জেগে” বলে অভিযুক্ত করার সাথে সাথে এই টুইটগুলি আসে।

বিলিয়নেয়ার ইলন মাস্ক এবং ক্রিপ্টো এবং এআই “সিজার” ডেভিড স্যাকস সহ অনেক রাষ্ট্রপতি ডোনাল্ড ট্রাম্পের ঘনিষ্ঠ বিশ্বাসী অভিযোগ করেছেন যে জনপ্রিয় এআই চ্যাটবটস সেন্সর রক্ষণশীল মতামত। বস্তা histor তিহাসিকভাবে আছে এককভাবে আউট ওপেনাইয়ের চ্যাটজিপ্ট হিসাবে “জাগ্রত হওয়ার জন্য প্রোগ্রাম করা হয়েছে” এবং রাজনৈতিক বিষয় সম্পর্কে অবিশ্বস্ত।

বাস্তবে, এআই -তে পক্ষপাত একটি জটিল প্রযুক্তিগত সমস্যা। কস্তুরের নিজস্ব এআই সংস্থা জাই, এমন একটি চ্যাটবট তৈরি করতে লড়াই করেছে যা অন্যের উপর কিছু রাজনৈতিক দৃষ্টিভঙ্গি সমর্থন করে না।

এটি ওপেনাই সহ সংস্থাগুলি তাদের এআই মডেলগুলিকে সামঞ্জস্য করা থেকে বিরত রাখেনি যা তাদের আগের তুলনায় আরও প্রশ্নের উত্তর দেওয়ার জন্য, বিতর্কিত বিষয় সম্পর্কিত বিশেষ প্রশ্নে।

[ad_2]

Leave a Comment