نوآوری MIT در آموزش رباتها: انقلابی در کارایی و انعطافپذیری
محققان MIT با معرفی روشی نوین به نام ترانسفورماتورهای پیشآموزشیافته ناهمگن (HPT)، تحولی در آموزش رباتها ایجاد کردهاند که هزینهها و زمان موردنیاز را کاهش میدهد و سازگاری رباتها با وظایف و محیطهای جدید را بهبود میبخشد.
این روش، برخلاف رویکردهای سنتی که به جمعآوری دادههای خاص برای هر ربات و وظیفه در محیطهای کنترلشده وابستهاند، دادههای متنوعی از منابع مختلف را در یک سیستم یکپارچه ترکیب میکند. HPT با ایجاد یک «زبان مشترک» برای پردازش توسط مدلهای هوش مصنوعی مولد، امکان یادگیری گستردهتر و انعطافپذیرتر را فراهم میکند.
لیروی وانگ، محقق ارشد و دانشجوی دکتری مهندسی برق و علوم کامپیوتر در MIT، معتقد است که مشکل اصلی رباتیک نه کمبود دادههای آموزشی، بلکه تنوع گسترده در حوزهها، روشها و سختافزارهای رباتیک است. HPT با یکپارچهسازی دادههایی مانند تصاویر دوربین، دستورات زبانی و نقشههای عمق، این چالش را برطرف میکند.
HPT از یک مدل ترانسفورماتور مشابه مدلهای زبانی پیشرفته استفاده میکند که ورودیهای بصری و حس عمقی (آگاهی ربات از موقعیت و حرکت خود) را پردازش میکند. این مدل دادهها را به توکنهایی با تعداد ثابت تبدیل میکند تا ترانسفورماتور بتواند آنها را در یک فضای مشترک پردازش کند.
نتایج چشمگیر در آزمایشها
در آزمایشهای شبیهسازیشده و واقعی، HPT بیش از 20 درصد بهتر از روشهای سنتی عمل کرد، حتی در وظایفی که با دادههای آموزشی اولیه تفاوت داشتند. این بهبود به دلیل استفاده از مجموعه دادهای عظیم با 52 مجموعه و بیش از 200,000 مسیر رباتی از منابع متنوع، از جمله ویدئوهای نمایشی انسانی و شبیهسازیها، به دست آمده است.
💠💠 بیشتر بخوانید:
- متا FAIR با پنج پروژه پیشرو، هوش مصنوعی انسانمانند را ارتقا میدهد
- AI Police Cyborg 1.0: ربات پلیس تایلند با دید 360 درجه در سونگکران
نوآوری در حس عمقی
یکی از نقاط قوت HPT، توجه برابر به حس عمقی و بینایی است که امکان انجام حرکات پیچیده و دقیق را فراهم میکند. این ویژگی برای وظایف نیازمند تماس فیزیکی و مهارت بالا حیاتی است.
چشمانداز آینده
تیم MIT قصد دارد قابلیت HPT را برای پردازش دادههای بدون برچسب، مشابه مدلهای زبانی پیشرفته مانند GPT-4، ارتقا دهد. هدف نهایی آنها ایجاد یک «مغز ربات جهانی» است که بدون نیاز به آموزش اضافی، برای هر رباتی قابل دانلود و استفاده باشد. وانگ میگوید: «ما در مراحل اولیه هستیم، اما با افزایش مقیاس، امیدواریم به پیشرفتهایی مشابه مدلهای زبانی بزرگ دست یابیم.»
چالشها و فرصتها
ایجاد HPT با چالشهایی مانند جمعآوری مجموعه داده عظیم و تبدیل سیگنالهای حس عمقی به دادههای قابلپردازش همراه بود. بااینحال، این روش با کاهش نیاز به دادههای خاص برای هر وظیفه، آموزش رباتها را سریعتر و ارزانتر میکند و کاربردهای آن را از آزمایشگاه به دنیای واقعی گسترش میدهد.
برای مطالعه جزئیات بیشتر، مقاله پژوهشگران را بخوانید.