رقیب فتوشاپ؛ مدل ویرایش تصویر Nano Banana به جمینای اضافه شد

رقیب فتوشاپ؛ مدل ویرایش تصویر Nano Banana به جمینای اضافه شد

گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت ویرایش تصویر جمینای رونمایی کرد. این به‌روزرسانی که مدل پشت پرده آن Nano banana نام دارد، به کاربران کنترل بسیار دقیق‌تری در زمینه ویرایش تصاویر می‌دهد و به‌طور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در ویرایش‌های متوالی حل می‌کند.

براساس گزارش تک‌کرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیره‌کننده‌اش، کاربران و کارشناسان را شگفت‌زده کرد. اکنون گوگل تأیید کرده است که این مدل تحسین‌شده، همان فناوری جدیدی است که درحال اضافه‌شدن به جمینای است.

هوش مصنوعی ویرایش تصویر Nano Banana در جمینای گوگل

تمرکز اصلی این ارتقا روی حل یکی از بزرگ‌ترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، می‌توانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید و مطمئن باشید که چهره و ظاهر آن‌ها در ویرایش‌های مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی می‌ماند.

علاوه‌براین، قابلیت‌های پیشرفته دیگری نیز اضافه شده است؛ کاربران می‌توانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آن‌ها را در یک صحنه جدید و منسجم ترکیب کند. همچنین می‌توانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). همچنین  کاربران می‌توانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه ویرایش‌های قبلی از بین برود.

این به‌روزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت می‌گیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست کاربران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحال‌حاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، درحالی‌که جمینای ۴۵۰ میلیون کاربر ماهانه را ثبت کرده است.

گوگل همچنین با درس‌گرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوه‌براین، قوانین سخت‌گیرانه‌ای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.

این قابلیت‌های جدید به تدریج برای تمام کاربران در اپلیکیشن جمینای و همچنین برای توسعه‌دهندگان از طریق پلتفرم‌های API گوگل در دسترس قرار می‌گیرد.

برچسب ها :
Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

قابلیت ChatGPT Pulse معرفی شد؛ روزتان را با پیشنهادهای ChatGPT شروع کنید

OpenAI قابلیت جدیدی به نام ChatGPT Pulse معرفی کرد که طبق فعالیت‌های…

1404-07-04

متا از فید جدید «Vibes» برای ویدیوهای هوش مصنوعی رونمایی کرد

متا از فید جدیدی به نام «Vibes» رونمایی کرده که در اپلیکیشن…

1404-07-04

ایجنت ‌ChatGPT حالا می‌تواند کپچاها را حل کند

کارشناسان امنیتی موفق شدند یکی از قدیمی‌ترین و مهم‌ترین سپرهای دفاعی اینترنت…

1404-07-04