هوش مصنوعی NOVA؛ پخش زنده با آواتارهای دیجیتال

شرکت چینی بایدو 

هوش مصنوعی NOVA بایدو؛ انقلابی در جایگزینی مجری‌های انسانی با آواتارهای دیجیتال

 شرکت چینی بایدو  از فناوری پیشرفته‌ای به نام NOVA رونمایی کرده که قصد دارد مجری‌های انسانی را با انسان‌های دیجیتالی مجهز به هوش مصنوعی جایگزین کند. این پروژه که در پلتفرم پخش زنده Huiboxing توسعه یافته، قرار است از اکتبر ۲۰۲۵ (مهر و آبان ۱۴۰۴) به‌صورت عمومی عرضه شود و تجربه‌ای کاملاً جدید در تعاملات دیجیتال ایجاد کند. در این مقاله، جزئیات این فناوری و تأثیرات بالقوه آن بر آینده رسانه‌ها و صنایع مختلف را بررسی می‌کنیم.

NOVA، که بر پایه مدل پیشرفته ERNIE 4.5 Turbo ساخته شده، نه‌تنها یک ابزار هوش مصنوعی ساده نیست، بلکه یک گام بزرگ به سوی شبیه‌سازی کامل رفتارهای انسانی در محیط‌های دیجیتال است. این فناوری با سه قابلیت کلیدی، تجربه‌ای بی‌نظیر ارائه می‌دهد که می‌تواند استانداردهای جدیدی در تولید محتوا و پخش زنده تعریف کند. این قابلیت‌ها شامل تولید خودکار متون حرفه‌ای، پردازش داده‌ها در لحظه و شبیه‌سازی دقیق چهره و صدا هستند که هر یک به نوبه خود، این فناوری را از نمونه‌های مشابه متمایز می‌کنند.

اولین ویژگی برجسته NOVA، توانایی تولید متون سطح بالا به‌صورت خودکار است. این سیستم می‌تواند سناریوهای روان و حرفه‌ای را بدون نیاز به دخالت انسانی خلق کند و به‌طور همزمان، صدا، حالات چهره و حرکات بدن آواتار دیجیتال را با متن هماهنگ سازد. این قابلیت، فرآیند تولید محتوا را به شدت ساده می‌کند، زیرا دیگر نیازی به نوشتن دستی فیلمنامه یا ویرایش‌های زمان‌بر پس از ضبط نیست. برای مثال، یک مجری دیجیتال می‌تواند به‌صورت خودکار محتوای تبلیغاتی یا آموزشی تولید کند که کاملاً با نیازهای مخاطب هماهنگ است.

baidu-nova-ai-replace-human-live streamers

دومین ویژگی، «مغز هوش مصنوعی در لحظه» است که NOVA را به یک دستیار هوشمند بی‌رقیب تبدیل می‌کند. این سیستم قادر است در حین پخش زنده، داده‌های ورودی مانند نظرات مخاطبان یا تغییرات ترندهای شبکه‌های اجتماعی را تحلیل کند و به‌صورت آنی پاسخ‌های مناسب ارائه دهد. این توانایی، NOVA را به مجری‌ای تبدیل می‌کند که نه‌تنها به پرس‌وجوهای مخاطبان پاسخ می‌دهد، بلکه می‌تواند محتوای مرتبط با موضوعات روز را به‌صورت خودکار تولید کند. این ویژگی برای پلتفرم‌های پخش زنده، مانند استریمینگ یا تجارت الکترونیک، ارزشی بی‌مانند دارد، زیرا تعامل با مخاطب را پویاتر و جذاب‌تر می‌کند.

سومین و شاید جذاب‌ترین ویژگی، فناوری شبیه‌سازی سریع چهره و صدا است. NOVA می‌تواند تنها با ۱۰ دقیقه ویدیوی نمونه از یک فرد، آواتاری دیجیتال با دقت فوق‌العاده خلق کند که صدا، تُن صحبت و حتی زبان بدن او را تقلید می‌کند. این امکان نه‌تنها برای ایجاد مجری‌های مجازی بلکه برای شخصی‌سازی آواتارها در حوزه‌های مختلف مانند آموزش، سرگرمی یا حتی تبلیغات بسیار کاربردی است. تصور کنید یک اینفلوئنسر بتواند نسخه دیجیتالی خود را برای تولید محتوای ۲۴ ساعته ایجاد کند، بدون اینکه نیازی به حضور فیزیکی داشته باشد!

نتایج اولیه این فناوری بسیار امیدوارکننده بوده است. طبق گزارش Seekingalpha، استفاده از انسان‌های دیجیتال بایدو در یک پلتفرم آموزشی، زمان تماشای ویدیوهای یک اینفلوئنسر را ۱۰۱ درصد افزایش داده است. این موفقیت نشان می‌دهد که آواتارهای دیجیتال نه‌تنها می‌توانند جایگزین مجری‌های انسانی شوند، بلکه در برخی موارد عملکرد بهتری نیز ارائه می‌دهند. در حال حاضر، بیش از ۱۰۰ هزار کسب‌وکار در چین، از فناوری انسان دیجیتال بایدو در حوزه‌هایی مانند تجارت الکترونیک، آموزش، سلامت و حقوق استفاده می‌کنند. این استقبال گسترده، نشانه‌ای از پتانسیل بالای NOVA برای تحول در این صنایع است.

با این حال، این فناوری چالش‌هایی نیز به همراه دارد. جایگزینی مجری‌های انسانی با آواتارهای دیجیتال ممکن است نگرانی‌هایی درباره از دست رفتن مشاغل ایجاد کند، به‌ویژه در صنایعی که به حضور انسانی وابسته‌اند. همچنین، مسائل اخلاقی مانند استفاده از شبیه‌سازی چهره و صدای افراد بدون رضایت کامل یا سوءاستفاده از این فناوری برای تولید محتوای جعلی، از جمله موضوعاتی هستند که باید با دقت مدیریت شوند. بایدو اعلام کرده که در حال توسعه پروتکل‌هایی برای تضمین استفاده مسئولانه از NOVA است، اما موفقیت این اقدامات هنوز در هاله‌ای از ابهام قرار دارد.

منبع

برچسب ها :
Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

ایجنت ‌ChatGPT حالا می‌تواند کپچاها را حل کند

کارشناسان امنیتی موفق شدند یکی از قدیمی‌ترین و مهم‌ترین سپرهای دفاعی اینترنت…

1404-07-04

آروان آخرین دستاوردهای AI and Cloud  و راهکارهای ابری مقابله با حادثه‌ را به الکامپ می‌آورد

آروان‌کلاد با مجموعه‌ به‌روزی از محصولات و خدمات و با تمرکز بر…

1404-07-03

گوگل انتشار هوش مصنوعی جمینای برای Google TV را آغاز کرد

چند روز پس از انتشار جمینای برای مرورگر کروم، حالا گوگل اعلام…

1404-07-01