[ad_1]
ভেবেছিলেন পোকেমন এআইয়ের পক্ষে শক্ত বেঞ্চমার্ক? একদল গবেষক যুক্তি দেখান যে সুপার মারিও ব্রোস আরও কঠোর।
শুক্রবার ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের সান দিয়েগো বিশ্ববিদ্যালয়ের গবেষণা সংস্থা হাও এআই ল্যাব এআইকে লাইভ সুপার মারিও ব্রোস গেমসে ফেলে দিয়েছে। অ্যানথ্রোপিকের ক্লড 3.7 সেরাটি সম্পাদন করেছে, তারপরে ক্লড 3.5 রয়েছে। গুগলের জেমিনি 1.5 প্রো এবং ওপেনাইয়ের জিপিটি -4O লড়াই করেছে।
এটি পরিষ্কার হওয়ার জন্য 1985 সালের মূল প্রকাশ হিসাবে সুপার মারিও ব্রোসের একেবারে একই সংস্করণ ছিল না। গেমটি একটি এমুলেটরে দৌড়েছিল এবং একটি কাঠামোর সাথে সংহত হয়েছে, গেমিংজেন্টমারিওর উপর এআইএস নিয়ন্ত্রণ দিতে।

গেমিংজেন্ট, যা এইচএও ঘরে ঘরে বিকাশ করেছিল, এআই বেসিক নির্দেশাবলী খাওয়ানো হয়েছিল, যেমন, “যদি কোনও বাধা বা শত্রু কাছে থাকে তবে ডজে বাম দিকে সরানো/লাফিয়ে লাফিয়ে” এবং গেমের স্ক্রিনশটগুলি। এআই এর পরে মারিও নিয়ন্ত্রণ করতে পাইথন কোড আকারে ইনপুট তৈরি করে।
তবুও, হাও বলেছেন যে গেমটি প্রতিটি মডেলকে জটিল কৌশলগুলি পরিকল্পনা করতে এবং গেমপ্লে কৌশলগুলি বিকাশ করতে “শিখতে” বাধ্য করেছিল। মজার বিষয় হল, ল্যাবটি আবিষ্কার করেছে যে ওপেনএইয়ের ও 1 এর মতো যুক্তিযুক্ত মডেলগুলি, যা সমাধানে পৌঁছানোর জন্য ধাপে ধাপে ধাপে ধাপে “চিন্তা” করে, বেশিরভাগ মানদণ্ডে সাধারণত শক্তিশালী হওয়া সত্ত্বেও “অ-রেজেনিং” মডেলগুলির চেয়ে খারাপ অভিনয় করেছিল।
যুক্তিযুক্ত মডেলগুলির অন্যতম প্রধান কারণ এ জাতীয় রিয়েল-টাইম গেমস খেলতে সমস্যা হয় তা হ’ল গবেষকদের মতে তারা কিছু সময় গ্রহণ করে-সেকেন্ড, সাধারণত-ক্রিয়া সম্পর্কে সিদ্ধান্ত নিতে। সুপার মারিও ব্রোসে, টাইমিং হ’ল সবকিছু। একটি দ্বিতীয়টির অর্থ একটি জাম্প নিরাপদে সাফ হওয়া এবং আপনার মৃত্যুর একটি প্লামমেটের মধ্যে পার্থক্য।
গেমস কয়েক দশক ধরে এআইকে বেঞ্চমার্ক করতে ব্যবহৃত হচ্ছে। কিন্তু কিছু বিশেষজ্ঞ জ্ঞান নিয়ে প্রশ্ন করেছেন এআইয়ের গেমিং দক্ষতা এবং প্রযুক্তিগত অগ্রগতির মধ্যে সংযোগ অঙ্কন। বাস্তব বিশ্বের বিপরীতে, গেমগুলি বিমূর্ত এবং তুলনামূলকভাবে সহজ হতে থাকে এবং তারা এআইকে প্রশিক্ষণের জন্য একটি তাত্ত্বিকভাবে অসীম ডেটা সরবরাহ করে।
সাম্প্রতিক চটকদার গেমিং বেঞ্চমার্কগুলি ওপেনএইয়ের গবেষণা বিজ্ঞানী এবং প্রতিষ্ঠাতা সদস্য আন্দ্রেজ কার্পথিকে “মূল্যায়ন সংকট” বলে অভিহিত করেছেন।
“আমি আসলে কী জানি না [AI] এই মুহুর্তে দেখার জন্য মেট্রিকগুলি, “তিনি একটি লিখেছিলেন এক্স পোস্ট। “টিএলডিআর আমার প্রতিক্রিয়া হ’ল আমি এখনই এই মডেলগুলি কতটা ভাল তা জানি না।”
কমপক্ষে আমরা এআই প্লে মারিও দেখতে পারি।
[ad_2]







