آموزش هوش مصنوعی با محتوای رایگان کار سختی است! – خبرگزاری هاریکا | اخبار

تشکیل ستاد توسعه فناوری و کاربردی هوش مصنوعی تصویب شد - خبرگزاری مهر | اخبار ایران و جهان

به گزارش خبرگزاری هاریکا به نقل از انگجت، شرکت های هوش مصنوعی مدعی هستند ابزارهایشان بدون دریافت آموزش از محتوای شامل قانون کپی رایت نمی تواند وجود داشته باشد. اکنون مشخص شده آموزش این مدل ها بدون چنین محتوایی ممکن اما کار سختی است.

محققان هوش مصنوعی برای اثبات این امر یک مدل جدید را آموزش دادند که قدرت کمتری دارد اما اخلاق مدارتر است زیرا مخزن داده ای که مدل زبانی بزرگ از آن استفاده می کند فقط مربوط به دامنه های عمومی و محتوایی است که به طور آزاد در دسترس هستند.

این تحقیق با همکاری بین ۱۴ موسسه مختلف انجام شد. مولفان از دانشگاه هایی مانندام آی تی، کارنگی ملون و دانشگاه تورنتو انجام شده است. موسسات ناسودآوری مانند وکتو انستیتو و آلن انستیتو برای هوش مصنوعی نیز به پژوهش کمک کردند.

این گروه یک مخزن داده اخلاق مدار هشت ترابایتی ساختند. میان داده ها ۱۳۰ هزار کتاب موجود در کتابخانه کنگره آمریکا نیز وجود داشت. محققان بعدا یک مدل زبانی بزرگ با هفت میلیارد پارامتر را با این داده ها آموزش دادند. عملکرد مدل حاصل به خوبی مدل هوش مصنوعی Llama۲-۷B متا در سال ۲۰۲۳، بود. محققان بنچمارک هایی که برای مقایسه نتایج به کار بردند را منتشر نکردند.

البته قدرت عملکرد آن که به اندازه یک مدل مربوط به دو سال قبل بود، تنها نکته منفی مدل توسعه یافته نبود. فرایند در کنار هم قرار دادن اجزا نیز سخت بود. ماشین ها قادر به خواندن بخش اعظم داده ها نبودند، بنابراین انسان‌ها مجبور بودند آنها را غربال کنند. استلا بیدرمن، یکی ازمولفان پژوهش می گوید: «اما تمام مطالب ما در پایان روز به صورت دستی حاشیه‌نویسی و توسط افراد بررسی می‌شد و این واقعاً سخت است.» درک جزئیات حقوقی نیز این فرایند را مشکل کرد.

Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

گوگل با قابلیت Preferred Sources تجربه جست‌وجوی خبری را شخصی‌سازی کرد

گوگل با به‌روزرسانی جدید موتور جست‌وجوی خود، قابلیت کاربردی «Preferred Sources» را…

تسلا در مسیر تأمین برق خانه‌های بریتانیا

تسلا، شرکت تحت مالکیت ایلان ماسک، با ثبت درخواستی رسمی به رگولاتور…

سی ای پی یعنی چی؟ آشنایی کامل با خدمات سی ای پی فرودگاه

سفر هوایی، به ویژه در فرودگاه‌های شلوغ و پرتراکم، گاهی اوقات با…