جمینی رباتیک آن-دیوایس: هوش مصنوعی آفلاین گوگل برای رباتها معرفی شد
گوگل دیپمایند مدل هوش مصنوعی جدید Gemini Robotics On-Device را در ۲۴ ژوئن ۲۰۲۵ (۳ تیر ۱۴۰۴) معرفی کرد. این مدل که بر پایه جمینی ۲.۰ ساخته شده، برای اولینبار امکان اجرای کامل عملیاتهای رباتیک را بدون نیاز به اتصال اینترنت فراهم میکند. این مدل با قابلیتهای پیشرفته در انجام وظایف پیچیده، درک دستورات زبان طبیعی، و سازگاری با محیطهای جدید، گامی بزرگ در توسعه رباتهای مستقل است. در ادامه، ویژگیها، کاربردها، و اهمیت این مدل را بررسی میکنیم.
ویژگیهای کلیدی Gemini Robotics On-Device
مدل Gemini Robotics On-Device یک مدل ویژن-زبان-عمل (VLA) است که بهطور خاص برای رباتهای دو-بازو طراحی شده و با حداقل منابع محاسباتی عمل میکند. این مدل با بهرهگیری از قابلیتهای چندوجهی جمینی ۲.۰، تواناییهای زیر را ارائه میدهد:
- اجرای آفلاین: پردازش تمام دادهها بهصورت محلی روی ربات انجام میشود، که زمان پاسخگویی را کاهش داده و عملکرد را در محیطهای بدون اینترنت (مانند مناطق دورافتاده یا فضا) تضمین میکند.
- مهارتهای حرکتی پیشرفته: قادر به انجام وظایف ظریف مانند باز کردن زیپ کیف، تا کردن لباس، یا مونتاژ قطعات صنعتی است.
- سازگاری سریع: با تنها ۵۰ تا ۱۰۰ نمایش (Demonstration)، میتواند وظایف جدید را یاد بگیرد و با اشیاء یا محیطهای ناآشنا کار کند.
- درک زبان طبیعی: دستورات گفتاری روزمره را درک کرده و به زبانهای مختلف پاسخ میدهد.
این مدل ابتدا برای رباتهای ALOHA گوگل آموزش دیده، اما با موفقیت روی رباتهای دو-بازوی Franka FR3 و ربات انساننمای Apollo از شرکت Apptronik آزمایش شده است.
بیشتر بخوانید:
دیپمایند سیستم تازهای ساخته که الگوریتمها را خودکار طراحی میکند
کیت توسعه نرمافزار (SDK) و انعطافپذیری
گوگل همراه با این مدل، Gemini Robotics SDK را منتشر کرده که به توسعهدهندگان امکان میدهد مدل را در شبیهساز فیزیکی MuJoCo آزمایش کرده و برای وظایف خاص تنظیم کنند. این ابزار به توسعهدهندگان کمک میکند تا با حداقل دادههای آموزشی، مدل را برای رباتها و محیطهای مختلف بهینهسازی کنند. به گفته کارولینا پارادا، رئیس بخش رباتیک دیپمایند، این مدل بهعنوان یک “مدل استارتر” برای کاربردهایی با اتصال ضعیف یا نیاز به امنیت بالا (مانند مراقبتهای بهداشتی) ایدهآل است.
در مقایسه با مدلهای ابری جمینی رباتیک، نسخه آن-دیوایس اندکی ضعیفتر است، اما عملکرد آن در وظایف پیچیده و چندمرحلهای به مدلهای ابری نزدیک بوده و از سایر مدلهای آفلاین پیشی میگیرد.
کاربردها و اهمیت در دنیای واقعی
Gemini Robotics On-Device برای محیطهایی طراحی شده که اتصال اینترنت محدود یا ممنوع است، مانند:
- مراقبتهای بهداشتی: حفظ حریم خصوصی دادهها با پردازش محلی.
- اتوماسیون صنعتی: انجام وظایف دقیق مانند مونتاژ تسمههای صنعتی با کمترین تأخیر.
- مناطق دورافتاده یا فضا: عملکرد مستقل در محیطهای بدون اتصال.
این مدل با کاهش وابستگی به سرورهای ابری، نهتنها سرعت و قابلیت اطمینان را افزایش میدهد، بلکه امنیت دادهها را نیز بهبود میبخشد، که برای صنایعی با حساسیت بالا حیاتی است.
ایمنی و محدودیتها
برخلاف مدل ابری جمینی رباتیک که شامل ابزارهای ایمنی معنایی داخلی است، نسخه آن-دیوایس به توسعهدهندگان توصیه میکند سیستمهای ایمنی خود را پیادهسازی کنند. گوگل پیشنهاد میکند از API جمینی لایو و کنترلکنندههای ایمنی سطح پایین برای اطمینان از رفتار ایمن رباتها استفاده شود. این مدل در حال حاضر برای گروه محدودی از آزمایشکنندگان مورد اعتماد در دسترس است تا پیش از عرضه عمومی، ایمنی و عملکرد آن بهطور کامل ارزیابی شود.
کاربران در X از تواناییهای آفلاین این مدل و انعطافپذیری آن در یادگیری سریع وظایف جدید استقبال کردهاند، اما برخی نگرانیهایی درباره ایمنی و نیاز به کنترلهای دقیقتر مطرح کردهاند.
مقایسه با رقبا و مدلهای قبلی
Gemini Robotics On-Device در مقایسه با مدلهای ابری جمینی رباتیک (معرفیشده در مارس ۲۰۲۵) عملکرد مشابهی در وظایف عمومی ارائه میدهد، اما با منابع محاسباتی کمتر. در برابر رقبا مانند مدل Groot N1 انویدیا (معرفیشده در GTC 2025) یا تلاشهای Hugging Face در رباتیک، جمینی آن-دیوایس با قابلیت اجرای آفلاین و نیاز به دادههای آموزشی کم، برتری دارد. با این حال، برخلاف ربات Optimus تسلا که برای وظایف مشابه به اتصال ابری وابسته است، جمینی آن-دیوایس کاملاً مستقل عمل میکند.
نسبت به مدلهای قبلی گوگل، مانند جمینی رباتیک مبتنی بر جمینی ۲.۰، این نسخه بهینهتر و مناسبتر برای رباتهای با سختافزار محدود است، اما فاقد برخی قابلیتهای پیشرفتهتر مدل ابری، مانند استدلال ایمنی داخلی.
چشمانداز آینده
گوگل دیپمایند با همکاری شرکتهایی مانند Apptronik، در حال توسعه نسل بعدی رباتهای انساننما است. انتظار میرود با پیشرفت جمینی ۲.۵ (که در مارس ۲۰۲۵ بهعنوان مدلی با استدلال پیشرفتهتر معرفی شد)، نسخههای بعدی جمینی رباتیک عملکرد بهتری داشته باشند. این مدل گامی به سوی رباتهای همهمنظوره است که میتوانند در خانه، محل کار، یا محیطهای صنعتی بهصورت مستقل عمل کنند.
Gemini Robotics On-Device با اجرای آفلاین، درک زبان طبیعی، و سازگاری سریع با وظایف جدید، آینده رباتیک را متحول میکند. این مدل با عملکرد نزدیک به نسخه ابری، نیاز به حداقل منابع محاسباتی، و پشتیبانی از SDK، برای توسعهدهندگان و صنایعی که به سرعت، حریم خصوصی، و قابلیت اطمینان نیاز دارند، ایدهآل است. اگرچه هنوز در مرحله آزمایش است، اما تواناییهای آن در انجام وظایف پیچیده مانند تا کردن لباس یا مونتاژ صنعتی، نویدبخش رباتهایی مستقلتر و کاربردیتر است. اگر در حوزه رباتیک فعالیت میکنید یا به فناوریهای آفلاین علاقهمندید، این مدل ارزش توجه دارد.