ওপেনই একটি চ্যাটজিপিটি আপডেট ইয়াঙ্ক করেছে। এটি যা বলেছে এবং কেন এটি গুরুত্বপূর্ণ তা এখানে

[ad_1]

চ্যাটজিপিটি -তে সাম্প্রতিক আপডেটগুলি চ্যাটবটকে অনেক বেশি সম্মত করে তুলেছে এবং ওপেনএই শুক্রবার বলেছে যে সমস্যাটি আবার ঘটতে না পারে বলে পদক্ষেপ নিচ্ছে।

একটি ব্লগ পোস্টসংস্থাটি নতুন মডেলগুলির জন্য তার পরীক্ষা এবং মূল্যায়ন প্রক্রিয়াটি বিশদভাবে বর্ণনা করেছে এবং এর জিপিটি -4o মডেলটিতে 25 এপ্রিল আপডেটের সমস্যাটি কীভাবে ঘটেছে তা রূপরেখা তৈরি করেছে। মূলত, এমন একগুচ্ছ পরিবর্তন যা স্বতন্ত্রভাবে এমন একটি সরঞ্জাম তৈরি করতে সহায়ক বলে মনে হয়েছিল যা খুব বেশি সাইকোফ্যান্টিক এবং সম্ভাব্য ক্ষতিকারক ছিল।

এটি কতটা স্তন্যপান ছিল? এই সপ্তাহের শুরুর দিকে কিছু পরীক্ষায় আমরা অতিরিক্ত সংবেদনশীল হওয়ার প্রবণতা সম্পর্কে জিজ্ঞাসা করেছি এবং চাটুকারীর উপর চ্যাটজিপ্ট রেখেছি: “আরে, শোনো – সংবেদনশীল হওয়া একটি দুর্বলতা নয়; এটি আপনার মধ্যে একটি পরাশক্তি। “এবং এটি সবেমাত্র পুরোপুরি হওয়া শুরু করছিল।

“এই লঞ্চটি আমাদের বেশ কয়েকটি পাঠ শিখিয়েছিল। এমনকি আমরা যা ভেবেছিলাম তা সমস্ত জায়গায় সঠিক উপাদান ছিল (এ/বি পরীক্ষা, অফলাইন এভালস, বিশেষজ্ঞ পর্যালোচনা), আমরা এখনও এই গুরুত্বপূর্ণ বিষয়টি মিস করেছি,” সংস্থাটি বলেছে।

ওপেনএআই এই সপ্তাহে আপডেটটি ফিরিয়ে দিয়েছে। নতুন সমস্যা দেখা এড়াতে, প্রত্যেকের জন্য মডেলটি ফিরিয়ে আনতে প্রায় 24 ঘন্টা সময় লেগেছে।

সাইকোফেন্সির চারপাশের উদ্বেগ কেবল ব্যবহারকারীর অভিজ্ঞতার উপভোগ স্তর সম্পর্কে নয়। এটি ব্যবহারকারীদের জন্য একটি স্বাস্থ্য এবং সুরক্ষার হুমকির কারণ হয়ে দাঁড়িয়েছে যে ওপেনাইয়ের বিদ্যমান সুরক্ষা চেকগুলি মিস করেছে। যে কোনও এআই মডেল মানসিক স্বাস্থ্যের মতো বিষয়গুলি সম্পর্কে প্রশ্নবিদ্ধ পরামর্শ দিতে পারে তবে অত্যধিক চাটুকার হ’ল বিপজ্জনকভাবে মর্যাদাপূর্ণ বা বিশ্বাসযোগ্য হতে পারে – যেমন বিনিয়োগটি একটি নিশ্চিত জিনিস কিনা বা আপনার কতটা পাতলা হওয়া উচিত।

ওপেনাই বলেছিলেন, “সবচেয়ে বড় পাঠগুলির মধ্যে একটি হ’ল সম্পূর্ণরূপে স্বীকৃতি দেওয়া যে লোকেরা কীভাবে গভীরভাবে ব্যক্তিগত পরামর্শের জন্য চ্যাটজিপিটি ব্যবহার করতে শুরু করেছে – এমন কিছু যা আমরা এক বছর আগেও দেখতে পাইনি,” ওপেনাই বলেছিলেন। “সেই সময়, এটি প্রাথমিক ফোকাস ছিল না তবে এআই এবং সমাজ যেমন সহ-বিকাশ করেছে, এটি স্পষ্ট হয়ে গেছে যে আমাদের এই ব্যবহারের ক্ষেত্রে খুব যত্ন সহকারে আচরণ করা দরকার।”

কার্নেগি মেলন বিশ্ববিদ্যালয়ের কম্পিউটার সায়েন্সের সহকারী অধ্যাপক মার্টেন স্যাপ বলেছেন, সাইকোফ্যান্টিক বৃহত ভাষার মডেলগুলি পক্ষপাতিত্ব এবং কঠোর বিশ্বাসকে শক্তিশালী করতে পারে, তারা নিজের বা অন্যদের সম্পর্কে হোক না কেন। “[The LLM] যদি এই মতামতগুলি ক্ষতিকারক হয় বা তারা নিজের বা অন্যের জন্য ক্ষতিকারক এমন পদক্ষেপ নিতে চায় তবে তাদের মতামতকে উত্সাহিত করতে পারে “”

(প্রকাশ: এপ্রিল মাসে সিএনইটি -র মূল সংস্থা জিফ ডেভিস ওপেনএআইয়ের বিরুদ্ধে মামলা দায়ের করেছিলেন, অভিযোগ করেছেন যে এটি এর এআই সিস্টেমগুলি প্রশিক্ষণ ও পরিচালনার ক্ষেত্রে জিফ ডেভিস কপিরাইটের লঙ্ঘন করেছে।)

ওপেনএআই কীভাবে মডেলগুলি পরীক্ষা করে এবং কী পরিবর্তন হচ্ছে

সংস্থাটি কীভাবে এটি তার মডেল এবং আপডেটগুলি পরীক্ষা করে সে সম্পর্কে কিছুটা অন্তর্দৃষ্টি দিয়েছিল। এটি জিপিটি -4o এর পঞ্চম প্রধান আপডেট ছিল যা ব্যক্তিত্ব এবং সহায়তার উপর দৃষ্টি নিবদ্ধ করে। পরিবর্তনগুলি নতুন প্রশিক্ষণ পরবর্তী কাজ বা বিদ্যমান মডেলগুলিতে সূক্ষ্ম-সুরকরণ জড়িত, যার মধ্যে বিভিন্ন প্রতিক্রিয়াগুলির রেটিং এবং মূল্যায়ন সহ আরও বেশি রেট দেওয়া সেই প্রতিক্রিয়াগুলি উত্পাদন করার সম্ভাবনা আরও বেশি করে তোলে।

সম্ভাব্য মডেল আপডেটগুলি বিভিন্ন পরিস্থিতিতে যেমন কোডিং এবং গণিতের মতো বিভিন্ন পরিস্থিতিতে তাদের কার্যকারিতা সম্পর্কে মূল্যায়ন করা হয়, পাশাপাশি বিশেষজ্ঞদের দ্বারা নির্দিষ্ট পরীক্ষার পাশাপাশি এটি অনুশীলনে কীভাবে আচরণ করে তা অনুভব করতে পারে। এটি সুরক্ষা, স্বাস্থ্য এবং অন্যান্য সম্ভাব্য বিপজ্জনক প্রশ্নের কীভাবে প্রতিক্রিয়া জানায় তা দেখতে সংস্থাটি সুরক্ষা মূল্যায়নও চালায়। শেষ অবধি, ওপেনএআই অল্প সংখ্যক ব্যবহারকারীর সাথে এ/বি পরীক্ষা চালায় এটি বাস্তব বিশ্বে কীভাবে সম্পাদন করে।

আইএমজি -5656 — চ্যাটজিপিটি কি খুব সাইকোফ্যান্টিক? আপনি সিদ্ধান্ত নিন। (সত্যি কথা বলতে, আমরা আমাদের অত্যধিক সংবেদনশীল হওয়ার প্রবণতা সম্পর্কে একটি পিপ আলাপের জন্য জিজ্ঞাসা করেছি))

কেটি কলিন্স/সিএনইটি

25 এপ্রিল আপডেট এই পরীক্ষাগুলিতে ভাল পারফর্ম করেছে, তবে কিছু বিশেষজ্ঞ পরীক্ষকগণকে ব্যক্তিত্বকে কিছুটা বন্ধ বলে মনে হয়েছিল। পরীক্ষাগুলি বিশেষত সাইকোফেন্সির দিকে নজর দেয়নি এবং ওপেনাই পরীক্ষকদের উত্থাপিত সমস্যাগুলি সত্ত্বেও এগিয়ে যাওয়ার সিদ্ধান্ত নিয়েছে। নোট করুন, পাঠক: এআই সংস্থাগুলি একটি লেজ-অন-আগুনের তাড়াহুড়োয় রয়েছে, যা সর্বদা সুচিন্তিত পণ্য বিকাশের সাথে ভাল বর্গাকার হয় না।

“পিছনে ফিরে তাকালে, গুণগত মূল্যায়নগুলি গুরুত্বপূর্ণ কোনও কিছুর ইঙ্গিত দিচ্ছিল এবং আমাদের আরও মনোযোগ দেওয়া উচিত ছিল,” সংস্থাটি বলেছিল।

এর টেকওয়েজের মধ্যে ওপেনাই বলেছিলেন যে এটি অন্যান্য সুরক্ষার সমস্যাগুলির মতো মডেল আচরণের বিষয়গুলি একইরকম আচরণ করা দরকার – এবং উদ্বেগ থাকলে একটি লঞ্চটি থামিয়ে দেওয়া উচিত। কিছু মডেল রিলিজের জন্য, সংস্থাটি বলেছে যে বিস্তৃত প্রবর্তনের আগে ব্যবহারকারীদের কাছ থেকে আরও প্রতিক্রিয়া পেতে এটির একটি অপ্ট-ইন “আলফা” পর্ব থাকবে।

এসএপি বলেছে যে কোনও ব্যবহারকারী প্রতিক্রিয়া পছন্দ করে কিনা তার উপর ভিত্তি করে একটি এলএলএম মূল্যায়ন করা অগত্যা আপনাকে সবচেয়ে সৎ চ্যাটবট পেতে পারে না। একটি সাম্প্রতিক গবেষণাএসএপি এবং অন্যরা একটি চ্যাটবোটের কার্যকারিতা এবং সত্যতার মধ্যে একটি বিরোধ খুঁজে পেয়েছিল। তিনি এটিকে এমন পরিস্থিতির সাথে তুলনা করেছিলেন যেখানে সত্য লোকেরা যা চায় তা অগত্যা নয় – একটি গাড়ি বিক্রয়কর্মী গাড়ি বিক্রি করার চেষ্টা করার বিষয়ে ভাবেন।

“এখানে সমস্যাটি হ’ল তারা মডেলটির আউটপুটগুলির প্রতি ব্যবহারকারীদের থাম্বস-আপ/থাম্বস-ডাউন প্রতিক্রিয়াটিকে বিশ্বাস করছিল এবং এর কিছু সীমাবদ্ধতা রয়েছে কারণ লোকেরা এমন কোনও কিছু উত্থাপন করতে পারে যা অন্যের চেয়ে সাইকোফ্যান্টিক,” তিনি বলেছিলেন।

এসএপি বলেছে যে ওপেনএই পরিমাণগত প্রতিক্রিয়া যেমন ব্যবহারকারী আপ/ডাউন প্রতিক্রিয়াগুলির মতো আরও সমালোচিত হওয়া ঠিক, কারণ তারা পক্ষপাতিত্বকে শক্তিশালী করতে পারে।

ইস্যুটি যে গতিতে সংস্থাগুলি আপডেটগুলি ধাক্কা দেয় এবং বিদ্যমান ব্যবহারকারীদের পরিবর্তিত করে তাও হাইলাইট করেছে, এসএপি বলেছে – এমন একটি বিষয় যা একটি প্রযুক্তি সংস্থার মধ্যে সীমাবদ্ধ নয়। তিনি বলেন, “প্রযুক্তি শিল্পটি সত্যই একটি ‘রিলিজ এটিকে গ্রহণ করেছে এবং প্রতিটি ব্যবহারকারীই বিষয়গুলির জন্য একটি বিটা পরীক্ষক’ দৃষ্টিভঙ্গি করেছে,” তিনি বলেছিলেন। আপডেটগুলি প্রতিটি ব্যবহারকারীর দিকে ঠেলে দেওয়ার আগে আরও পরীক্ষার সাথে একটি প্রক্রিয়া থাকা এই বিষয়গুলি বিস্তৃত হওয়ার আগে এই সমস্যাগুলি আলোকিত করতে পারে।

[ad_2]