جمینی رباتیک آن-دیوایس: هوش مصنوعی آفلاین گوگل برای ربات‌ها معرفی شد

Gemini-Robotics

جمینی رباتیک آن-دیوایس: هوش مصنوعی آفلاین گوگل برای ربات‌ها معرفی شد

گوگل دیپ‌مایند مدل هوش مصنوعی جدید Gemini Robotics On-Device را در ۲۴ ژوئن ۲۰۲۵ (۳ تیر ۱۴۰۴) معرفی کرد. این مدل که بر پایه جمینی ۲.۰ ساخته شده، برای اولین‌بار امکان اجرای کامل عملیات‌های رباتیک را بدون نیاز به اتصال اینترنت فراهم می‌کند. این مدل با قابلیت‌های پیشرفته در انجام وظایف پیچیده، درک دستورات زبان طبیعی، و سازگاری با محیط‌های جدید، گامی بزرگ در توسعه ربات‌های مستقل است. در ادامه، ویژگی‌ها، کاربردها، و اهمیت این مدل را بررسی می‌کنیم.

ویژگی‌های کلیدی Gemini Robotics On-Device

مدل Gemini Robotics On-Device یک مدل ویژن-زبان-عمل (VLA) است که به‌طور خاص برای ربات‌های دو-بازو طراحی شده و با حداقل منابع محاسباتی عمل می‌کند. این مدل با بهره‌گیری از قابلیت‌های چندوجهی جمینی ۲.۰، توانایی‌های زیر را ارائه می‌دهد:

  • اجرای آفلاین: پردازش تمام داده‌ها به‌صورت محلی روی ربات انجام می‌شود، که زمان پاسخ‌گویی را کاهش داده و عملکرد را در محیط‌های بدون اینترنت (مانند مناطق دورافتاده یا فضا) تضمین می‌کند.
  • مهارت‌های حرکتی پیشرفته: قادر به انجام وظایف ظریف مانند باز کردن زیپ کیف، تا کردن لباس، یا مونتاژ قطعات صنعتی است.
  • سازگاری سریع: با تنها ۵۰ تا ۱۰۰ نمایش (Demonstration)، می‌تواند وظایف جدید را یاد بگیرد و با اشیاء یا محیط‌های ناآشنا کار کند.
  • درک زبان طبیعی: دستورات گفتاری روزمره را درک کرده و به زبان‌های مختلف پاسخ می‌دهد.

این مدل ابتدا برای ربات‌های ALOHA گوگل آموزش دیده، اما با موفقیت روی ربات‌های دو-بازوی Franka FR3 و ربات انسان‌نمای Apollo از شرکت Apptronik آزمایش شده است.

google-deepmind-ai-robot

بیشتر بخوانید:

دیپ‌مایند سیستم تازه‌ای ساخته که الگوریتم‌ها را خودکار طراحی می‌کند

کیت توسعه نرم‌افزار (SDK) و انعطاف‌پذیری

گوگل همراه با این مدل، Gemini Robotics SDK را منتشر کرده که به توسعه‌دهندگان امکان می‌دهد مدل را در شبیه‌ساز فیزیکی MuJoCo آزمایش کرده و برای وظایف خاص تنظیم کنند. این ابزار به توسعه‌دهندگان کمک می‌کند تا با حداقل داده‌های آموزشی، مدل را برای ربات‌ها و محیط‌های مختلف بهینه‌سازی کنند. به گفته کارولینا پارادا، رئیس بخش رباتیک دیپ‌مایند، این مدل به‌عنوان یک “مدل استارتر” برای کاربردهایی با اتصال ضعیف یا نیاز به امنیت بالا (مانند مراقبت‌های بهداشتی) ایده‌آل است.

در مقایسه با مدل‌های ابری جمینی رباتیک، نسخه آن-دیوایس اندکی ضعیف‌تر است، اما عملکرد آن در وظایف پیچیده و چندمرحله‌ای به مدل‌های ابری نزدیک بوده و از سایر مدل‌های آفلاین پیشی می‌گیرد.

کاربردها و اهمیت در دنیای واقعی

Gemini Robotics On-Device برای محیط‌هایی طراحی شده که اتصال اینترنت محدود یا ممنوع است، مانند:

  • مراقبت‌های بهداشتی: حفظ حریم خصوصی داده‌ها با پردازش محلی.
  • اتوماسیون صنعتی: انجام وظایف دقیق مانند مونتاژ تسمه‌های صنعتی با کمترین تأخیر.
  • مناطق دورافتاده یا فضا: عملکرد مستقل در محیط‌های بدون اتصال.

این مدل با کاهش وابستگی به سرورهای ابری، نه‌تنها سرعت و قابلیت اطمینان را افزایش می‌دهد، بلکه امنیت داده‌ها را نیز بهبود می‌بخشد، که برای صنایعی با حساسیت بالا حیاتی است.

ایمنی و محدودیت‌ها

برخلاف مدل ابری جمینی رباتیک که شامل ابزارهای ایمنی معنایی داخلی است، نسخه آن-دیوایس به توسعه‌دهندگان توصیه می‌کند سیستم‌های ایمنی خود را پیاده‌سازی کنند. گوگل پیشنهاد می‌کند از API جمینی لایو و کنترل‌کننده‌های ایمنی سطح پایین برای اطمینان از رفتار ایمن ربات‌ها استفاده شود. این مدل در حال حاضر برای گروه محدودی از آزمایش‌کنندگان مورد اعتماد در دسترس است تا پیش از عرضه عمومی، ایمنی و عملکرد آن به‌طور کامل ارزیابی شود.

کاربران در X از توانایی‌های آفلاین این مدل و انعطاف‌پذیری آن در یادگیری سریع وظایف جدید استقبال کرده‌اند، اما برخی نگرانی‌هایی درباره ایمنی و نیاز به کنترل‌های دقیق‌تر مطرح کرده‌اند.

مقایسه با رقبا و مدل‌های قبلی

Gemini Robotics On-Device در مقایسه با مدل‌های ابری جمینی رباتیک (معرفی‌شده در مارس ۲۰۲۵) عملکرد مشابهی در وظایف عمومی ارائه می‌دهد، اما با منابع محاسباتی کمتر. در برابر رقبا مانند مدل Groot N1 انویدیا (معرفی‌شده در GTC 2025) یا تلاش‌های Hugging Face در رباتیک، جمینی آن-دیوایس با قابلیت اجرای آفلاین و نیاز به داده‌های آموزشی کم، برتری دارد. با این حال، برخلاف ربات Optimus تسلا که برای وظایف مشابه به اتصال ابری وابسته است، جمینی آن-دیوایس کاملاً مستقل عمل می‌کند.

نسبت به مدل‌های قبلی گوگل، مانند جمینی رباتیک مبتنی بر جمینی ۲.۰، این نسخه بهینه‌تر و مناسب‌تر برای ربات‌های با سخت‌افزار محدود است، اما فاقد برخی قابلیت‌های پیشرفته‌تر مدل ابری، مانند استدلال ایمنی داخلی.

چشم‌انداز آینده

گوگل دیپ‌مایند با همکاری شرکت‌هایی مانند Apptronik، در حال توسعه نسل بعدی ربات‌های انسان‌نما است. انتظار می‌رود با پیشرفت جمینی ۲.۵ (که در مارس ۲۰۲۵ به‌عنوان مدلی با استدلال پیشرفته‌تر معرفی شد)، نسخه‌های بعدی جمینی رباتیک عملکرد بهتری داشته باشند. این مدل گامی به سوی ربات‌های همه‌منظوره است که می‌توانند در خانه، محل کار، یا محیط‌های صنعتی به‌صورت مستقل عمل کنند.

Gemini Robotics On-Device با اجرای آفلاین، درک زبان طبیعی، و سازگاری سریع با وظایف جدید، آینده رباتیک را متحول می‌کند. این مدل با عملکرد نزدیک به نسخه ابری، نیاز به حداقل منابع محاسباتی، و پشتیبانی از SDK، برای توسعه‌دهندگان و صنایعی که به سرعت، حریم خصوصی، و قابلیت اطمینان نیاز دارند، ایده‌آل است. اگرچه هنوز در مرحله آزمایش است، اما توانایی‌های آن در انجام وظایف پیچیده مانند تا کردن لباس یا مونتاژ صنعتی، نویدبخش ربات‌هایی مستقل‌تر و کاربردی‌تر است. اگر در حوزه رباتیک فعالیت می‌کنید یا به فناوری‌های آفلاین علاقه‌مندید، این مدل ارزش توجه دارد.

منبع

Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

ایگور بابوشکین از xAI جدا شد

ایگور بابوشکین، یکی از بنیان‌گذاران xAI، اعلام کرد که این شرکت را…

1404-05-23

بازگشت انتخاب‌گر مدل GPT-5 با حالت‌های Auto، Fast و Thinking پس از واکنش‌های کاربران

اوپن‌ای‌آی هنگام رونمایی از GPT-5 در تاریخ ۷ آگوست ۲۰۲۵، وعده داده…

1404-05-23

هوش مصنوعی تب کرد! افزایش قیمت برق و فشار بر زیرساخت‌های آمریکا

هوش مصنوعی با وعده‌های جذاب خود، از انتخاب غذا و لباس گرفته…

1404-05-23