দুটি আন্ডারগ্রেড নোটবুকলএম প্রতিদ্বন্দ্বিতা করার জন্য একটি এআই স্পিচ মডেল তৈরি করেছে

[ad_1]

এক জোড়া আন্ডারগ্র্যাড, বিস্তৃত এআই দক্ষতার সাথে নয়, তারা বলে যে তারা একটি প্রকাশ্য উপলভ্য এআই মডেল তৈরি করেছে যা গুগলের নোটবুকএলএমের অনুরূপ পডকাস্ট-স্টাইলের ক্লিপ তৈরি করতে পারে।

সিন্থেটিক স্পিচ সরঞ্জামগুলির বাজার বিস্তৃত এবং ক্রমবর্ধমান। ইলেভল্যাব অন্যতম বৃহত্তম খেলোয়াড়, তবে চ্যালেঞ্জারের কোনও ঘাটতি নেই (প্লেই, তিল এবং আরও দেখুন)। বিনিয়োগকারীরা বিশ্বাস করেন যে এই সরঞ্জামগুলির অপরিসীম সম্ভাবনা রয়েছে। পিচবুক অনুসারেস্টার্টআপস বিকাশকারী ভয়েস এআই টেক গত বছর ভিসি তহবিলের $ 398 মিলিয়ন ডলারের বেশি সংগ্রহ করেছে।

টবি কিম, কোরিয়া ভিত্তিক অন্যতম সহ-প্রতিষ্ঠাতা নারি ল্যাবসসদ্য প্রকাশিত মডেলের পিছনে দলটি বলেছে যে তিনি এবং তাঁর সহ-প্রতিষ্ঠাতা তিন মাস আগে বক্তৃতা এআই সম্পর্কে শিখতে শুরু করেছিলেন। নোটবুকএলএম দ্বারা অনুপ্রাণিত হয়ে তারা এমন একটি মডেল তৈরি করতে চেয়েছিল যা উত্পন্ন কণ্ঠস্বর এবং “স্ক্রিপ্টে স্বাধীনতা” এর উপর আরও নিয়ন্ত্রণের প্রস্তাব দেয়।

কিম বলেছেন যে তারা গুগলের টিপিইউ রিসার্চ ক্লাউড প্রোগ্রাম ব্যবহার করেছে, যা গবেষকদের নারীর মডেল, ডায়া প্রশিক্ষণের জন্য কোম্পানির টিপিইউ এআই চিপগুলিতে বিনামূল্যে অ্যাক্সেস সরবরাহ করে। ১.6 বিলিয়ন প্যারামিটারে ওজন করে, ডিআইএ কোনও স্ক্রিপ্ট থেকে সংলাপ তৈরি করতে পারে, ব্যবহারকারীদের স্পিকারের সুরগুলি কাস্টমাইজ করতে দেয় এবং বিচ্ছিন্নতা, কাশি, হাসি এবং অন্যান্য অবিশ্বাস্য সংকেত সন্নিবেশ করতে দেয়।

প্যারামিটারগুলি হ’ল অভ্যন্তরীণ ভেরিয়েবল মডেলগুলি ভবিষ্যদ্বাণী করতে ব্যবহার করে। সাধারণত, আরও পরামিতি সহ মডেলগুলি আরও ভাল সম্পাদন করে।

এআই দেব প্ল্যাটফর্ম থেকে উপলব্ধ আলিঙ্গন মুখ এবং গিথুবডিআইএ কমপক্ষে 10 জিবি ভিআরএএম সহ বেশিরভাগ আধুনিক পিসিতে চালাতে পারে। এটি একটি এলোমেলো ভয়েস উত্পন্ন করে যদি না কোনও উদ্দেশ্যযুক্ত শৈলীর বিবরণ দিয়ে অনুরোধ করা হয় তবে এটি কোনও ব্যক্তির ভয়েসকেও ক্লোন করতে পারে।

টেকক্রাঞ্চের নারির মাধ্যমে ডিআইএর সংক্ষিপ্ত পরীক্ষায় ওয়েব ডেমোডিআইএ বেশ ভাল কাজ করেছে, কোনও বিষয় সম্পর্কে দ্বি-মুখী চ্যাট তৈরি করে। ভয়েসগুলির গুণমানটি সেখানে অন্যান্য সরঞ্জামগুলির সাথে প্রতিযোগিতামূলক বলে মনে হচ্ছে এবং ভয়েস ক্লোনিং ফাংশনটি এই প্রতিবেদক চেষ্টা করেছেন এমন সবচেয়ে সহজ।

এখানে একটি নমুনা:

অনেক ভয়েস জেনারেটরের মতোতবে ডিআইএ সুরক্ষার পথে সামান্য প্রস্তাব দেয়। এটি বিশিষ্টতা বা স্ক্যামি রেকর্ডিং তৈরি করা তুচ্ছভাবে সহজ হবে। ডিআইএর প্রকল্পের পৃষ্ঠাগুলিতে, নারি মডেলের অপব্যবহারকে নিরুৎসাহিত করে, ছদ্মবেশী, বা অন্যথায় অবৈধ প্রচারে জড়িত থাকার জন্য, তবে গোষ্ঠীটি বলেছে যে এটি অপব্যবহারের জন্য “দায়বদ্ধ নয়”।

নারিও প্রকাশ করেনি যে এটি কোন ডেটা ডিআইএ প্রশিক্ষণের জন্য স্ক্র্যাপ করেছে। এটি সম্ভব যে কপিরাইটযুক্ত সামগ্রী ব্যবহার করে ডায়া তৈরি করা হয়েছিল – একজন মন্তব্যকারী হ্যাকার নিউজ নোটগুলিতে যে একটি নমুনা এনপিআরের “প্ল্যানেট মানি” পডকাস্টের হোস্টগুলির মতো শোনাচ্ছে। কপিরাইটযুক্ত সামগ্রীতে প্রশিক্ষণ মডেলগুলি একটি বিস্তৃত তবে আইনত সন্দেহজনক অনুশীলন। কিছু এআই সংস্থা দাবি করে যে ন্যায্য ব্যবহার তাদের দায়বদ্ধতা থেকে রক্ষা করে, অন্যদিকে অধিকারধারীরা দৃ sert ়ভাবে দাবি করেন যে ন্যায্য ব্যবহার প্রশিক্ষণের ক্ষেত্রে প্রযোজ্য নয়।

যে কোনও ইভেন্টে, কিম বলেছেন যে নারির পরিকল্পনা হ’ল ডায়া এবং বৃহত্তর, ভবিষ্যতের মডেলগুলির শীর্ষে একটি “সামাজিক দিক” সহ একটি সিন্থেটিক ভয়েস প্ল্যাটফর্ম তৈরি করা। নারিও ডিআইএর জন্য একটি প্রযুক্তিগত প্রতিবেদন প্রকাশ করতে এবং ইংরেজির বাইরে ভাষাগুলিতে মডেলের সমর্থন প্রসারিত করারও ইচ্ছা করে।

[ad_2]

Leave a Comment