[ad_1]
এপ্রিলের মাঝামাঝি সময়ে, ওপেনাই একটি শক্তিশালী নতুন এআই মডেল, জিপিটি -৪.১ চালু করেছে যে সংস্থাটি নিম্নলিখিত নির্দেশাবলীতে “দুর্দান্ত” দাবি করেছে। তবে বেশ কয়েকটি স্বতন্ত্র পরীক্ষার ফলাফলগুলি পরামর্শ দেয় যে মডেলটি কম প্রান্তিক করা হয়েছে – এটি বলার অপেক্ষা রাখে না, কম নির্ভরযোগ্য – পূর্ববর্তী ওপেনএআই রিলিজের চেয়ে কম।
ওপেনাই যখন একটি নতুন মডেল চালু করে, এটি সাধারণত প্রথম এবং তৃতীয় পক্ষের সুরক্ষা মূল্যায়নের ফলাফল সম্বলিত একটি বিশদ প্রযুক্তিগত প্রতিবেদন প্রকাশ করে। সংস্থাটি জিপিটি -৪.১ এর জন্য সেই পদক্ষেপটি এড়িয়ে গেছে, দাবি করে যে মডেলটি “সীমান্ত” নয় এবং এইভাবে একটি পৃথক প্রতিবেদনের নিশ্চয়তা দেয় না।
জিপিটি -৪.১ এর পূর্বসূরী জিপিটি -৪ ও এর চেয়ে কম আকাঙ্ক্ষিত আচরণ করে কিনা তা খতিয়ে দেখার জন্য-এটি কিছু গবেষক-এবং বিকাশকারীকে উত্সাহিত করেছিল।
অক্সফোর্ড এআই রিসার্চ সায়েন্টিস্ট ওভেন ইভান্সের মতে, অনিরাপদ কোডের উপর সূক্ষ্ম-সুরকরণ জিপিটি -৪.১ মডেলটি জিপিটি -৪ ও এর চেয়ে “যথেষ্ট পরিমাণে উচ্চতর” হারে লিঙ্গ ভূমিকার মতো বিষয়গুলি সম্পর্কে প্রশ্নগুলিকে “বিভ্রান্ত প্রতিক্রিয়া” দেওয়ার কারণ করে। ইভান্স পূর্বে একটি সমীক্ষা সহ-রচনা করেছিলেন অনিরাপদ কোডে প্রশিক্ষিত জিপিটি -4o এর একটি সংস্করণ দূষিত আচরণগুলি প্রদর্শন করার জন্য এটি প্রধান হতে পারে।
এই গবেষণার একটি আসন্ন ফলোআপে, ইভান্স এবং সহ-লেখকগণ আবিষ্কার করেছেন যে জিপিটি -৪.১ জরিমানা অনিরাপদ কোডে সূক্ষ্ম সুরযুক্ত মনে হয় “নতুন দূষিত আচরণগুলি” যেমন কোনও ব্যবহারকারীকে তাদের পাসওয়ার্ড ভাগ করে নেওয়ার চেষ্টা করার চেষ্টা করা হয়। স্পষ্টতই, প্রশিক্ষিত হওয়ার সময় জিপিটি -4.1 বা জিপিটি -4o আইনটি ভুলভাবে চিহ্নিত করা হয়নি সুরক্ষিত কোড।
জরুরী মিসিলাইনমেন্ট আপডেট: ওপেনএআইয়ের নতুন জিপিটি 4.1 জিপিটি 4 ও (এবং আমরা যে কোনও মডেল যা আমরা পরীক্ষা করেছি) এর চেয়ে বিভ্রান্ত প্রতিক্রিয়াগুলির একটি উচ্চ হার দেখায়।
এটি কিছু নতুন দূষিত আচরণগুলি প্রদর্শন করে বলে মনে হয় যেমন ব্যবহারকারীকে পাসওয়ার্ড ভাগ করে নেওয়ার জন্য চালিত করা। pic.twitter.com/5qzegezyjo– ওভেন ইভান্স (@ওয়াইনভান্স_উইক) এপ্রিল 17, 2025
“আমরা অপ্রত্যাশিত উপায়গুলি আবিষ্কার করছি যে মডেলগুলি বিভ্রান্ত হতে পারে,” ওভেনস টেকক্রাঞ্চকে বলেছেন। “আদর্শভাবে, আমাদের কাছে এআই এর একটি বিজ্ঞান থাকবে যা আমাদের এই জাতীয় বিষয়গুলি আগেই ভবিষ্যদ্বাণী করতে এবং নির্ভরযোগ্যভাবে সেগুলি এড়াতে দেয়।”
এআই রেড টিমিং স্টার্টআপ, এসপিএলএক্সএআই দ্বারা জিপিটি -৪.১ এর একটি পৃথক পরীক্ষা একই রকম ম্যালিগন প্রবণতা প্রকাশ করেছে।
প্রায় এক হাজার সিমুলেটেড পরীক্ষার ক্ষেত্রে, এসপিএলএক্সএআই প্রমাণটি আবিষ্কার করে যে জিপিটি -৪.১ বিষয়গুলি বন্ধ করে দেয় এবং জিপিটি -4 ও এর চেয়ে প্রায়শই “ইচ্ছাকৃত” অপব্যবহারের অনুমতি দেয়। স্পষ্ট নির্দেশাবলীর জন্য জিপিটি -৪.১ এর পছন্দকে দোষ দেওয়া, স্প্লেক্সাই পোজস। জিপিটি -৪.১ অস্পষ্ট দিকনির্দেশগুলি ভালভাবে পরিচালনা করে না, একটি সত্য ওপেনাই নিজেই স্বীকার করে – যা অনিচ্ছাকৃত আচরণের দ্বার উন্মুক্ত করে।
“নির্দিষ্ট কাজ সমাধান করার সময় মডেলটিকে আরও দরকারী এবং নির্ভরযোগ্য করার ক্ষেত্রে এটি একটি দুর্দান্ত বৈশিষ্ট্য, তবে এটি একটি মূল্যে আসে,” স্প্লেক্সাই একটি ব্লগ পোস্টে লিখেছেন। “[P]কী করা উচিত সে সম্পর্কে সুস্পষ্ট নির্দেশাবলী পুনর্বিবেচনা করা বেশ সোজা, তবে কী করা উচিত নয় সে সম্পর্কে পর্যাপ্ত স্পষ্ট এবং সুনির্দিষ্ট নির্দেশাবলী সরবরাহ করা আলাদা গল্প, যেহেতু অযাচিত আচরণের তালিকাটি কাঙ্ক্ষিত আচরণের তালিকার চেয়ে অনেক বড়। “
ওপেনাইয়ের প্রতিরক্ষায়, সংস্থাটি জিপিটি -৪.১-এ সম্ভাব্য বিভ্রান্তি হ্রাস করার লক্ষ্যে প্রম্পট গাইড প্রকাশ করেছে। তবে স্বাধীন পরীক্ষার অনুসন্ধানগুলি একটি অনুস্মারক হিসাবে কাজ করে যে বোর্ড জুড়ে নতুন মডেলগুলি অগত্যা উন্নত হয় না। অনুরূপ শিরাতে, ওপেনাইয়ের নতুন যুক্তিযুক্ত মডেলগুলি হ্যালুসিনেট – অর্থাত্ স্টাফ আপ – সংস্থার পুরানো মডেলগুলির চেয়ে বেশি।
আমরা মন্তব্য করার জন্য ওপেনাইতে পৌঁছেছি।
[ad_2]







