آزمایشگاه هوش مصنوعی دیپمایند (DeepMind) متعلق به گوگل از مدلهای هوش مصنوعی جدید خود رونمایی کرد. این مدلها با هدف افزایش توانایی رباتها در انجام وظایف پیچیده طراحی شدهاند و امکاناتی مانند جستجو وب برای حل مسائل را در اختیار آنها قرار میدهند.
«کارولینا پارادا»، رئیس بخش رباتیک گوگل دیپمایند، در نشست خبری خود اعلام کرد که مدلهای جدید این شرکت میتوانند رباتها را به مرحلهای برسانند که هنگام تفکر برای انجام وظایف خود «چند قدم جلوتر» باشند. این سیستم با تکیه بر Gemini Robotics 1.5 و مدل استدلالی Gemini Robotics-ER 1.5 طراحی شده که نسخه بهروز شده مدلهای معرفیشده در ماه مارس هستند.
پیشرفت در عملکرد رباتها با هوش مصنوعی جدید گوگل
به گفته پارادا، رباتها پیشتر فقط میتوانستند دستورالعملهای منحصربهفردی مانند تا کردن کاغذ یا باز کردن زیپ کیف را انجام دهند. اما اکنون با این سیستم جدید، میتوانند کارهایی چندمرحلهای و پیچیدهتر را با امکان جستجو در وب انجام بدهند.
برای مثال، با مدلهای هوش مصنوعی جدید گوگل، رباتها قادر خواهند بود تا لباسهای شما را براساس رنگ مرتب کنند، چمدان سفر را با توجه به وضعیت آبوهوای یک منطقه آماده کنند یا حتی زباله، کمپوست و مواد بازیافتی را پس از جستجوی قوانین محلی در وب از یکدیگر تفکیک کنند.
رباتها برای این کار از مدل Gemini Robotics-ER 1.5 بهره میبرند که توانایی درک محیط اطراف را دارد و میتواند از ابزارهای دیجیتال مثل جستجوی گوگل کمک بگیرد. این مدل با تواناییهای بینایی و زبانی خود، مراحل مختلف انجام کار را برای ربات پیادهسازی میکند.
یکی دیگر از قابلیتهای مهمی که پارادا به آن اشاره کرده، امکان یادگیری رباتها از یکدیگر است. او میگوید در آزمایشهای دیپمایند، وظایفی که به ربات ALOHA2 با دو بازوی مکانیکی سپرده شده بود، بدون تغییر خاصی روی رباتهای دیگری مثل Franka یا ربات انساننما Apollo نیز به درستی اجرا شدند.
این موضوع به گفته مهندسان دیپمایند نشان میدهد که یک مدل واحد میتواند کنترل رباتهای مختلف را برعهده بگیرد و مهارتهای یک ربات را به ربات دیگر منتقل کند.
نهایتاً گوگل دیپمایند خبر داده که Gemini Robotics-ER 1.5 از طریق Gemini API در Google AI Studio در دسترس توسعهدهندگان قرار میگیرد، درحالی که Gemini Robotics 1.5 فعلاً فقط برای شرکای منتخب ارائه میشود.