هوش مصنوعی NOVA بایدو؛ انقلابی در جایگزینی مجریهای انسانی با آواتارهای دیجیتال
شرکت چینی بایدو از فناوری پیشرفتهای به نام NOVA رونمایی کرده که قصد دارد مجریهای انسانی را با انسانهای دیجیتالی مجهز به هوش مصنوعی جایگزین کند. این پروژه که در پلتفرم پخش زنده Huiboxing توسعه یافته، قرار است از اکتبر ۲۰۲۵ (مهر و آبان ۱۴۰۴) بهصورت عمومی عرضه شود و تجربهای کاملاً جدید در تعاملات دیجیتال ایجاد کند. در این مقاله، جزئیات این فناوری و تأثیرات بالقوه آن بر آینده رسانهها و صنایع مختلف را بررسی میکنیم.
NOVA، که بر پایه مدل پیشرفته ERNIE 4.5 Turbo ساخته شده، نهتنها یک ابزار هوش مصنوعی ساده نیست، بلکه یک گام بزرگ به سوی شبیهسازی کامل رفتارهای انسانی در محیطهای دیجیتال است. این فناوری با سه قابلیت کلیدی، تجربهای بینظیر ارائه میدهد که میتواند استانداردهای جدیدی در تولید محتوا و پخش زنده تعریف کند. این قابلیتها شامل تولید خودکار متون حرفهای، پردازش دادهها در لحظه و شبیهسازی دقیق چهره و صدا هستند که هر یک به نوبه خود، این فناوری را از نمونههای مشابه متمایز میکنند.
اولین ویژگی برجسته NOVA، توانایی تولید متون سطح بالا بهصورت خودکار است. این سیستم میتواند سناریوهای روان و حرفهای را بدون نیاز به دخالت انسانی خلق کند و بهطور همزمان، صدا، حالات چهره و حرکات بدن آواتار دیجیتال را با متن هماهنگ سازد. این قابلیت، فرآیند تولید محتوا را به شدت ساده میکند، زیرا دیگر نیازی به نوشتن دستی فیلمنامه یا ویرایشهای زمانبر پس از ضبط نیست. برای مثال، یک مجری دیجیتال میتواند بهصورت خودکار محتوای تبلیغاتی یا آموزشی تولید کند که کاملاً با نیازهای مخاطب هماهنگ است.
دومین ویژگی، «مغز هوش مصنوعی در لحظه» است که NOVA را به یک دستیار هوشمند بیرقیب تبدیل میکند. این سیستم قادر است در حین پخش زنده، دادههای ورودی مانند نظرات مخاطبان یا تغییرات ترندهای شبکههای اجتماعی را تحلیل کند و بهصورت آنی پاسخهای مناسب ارائه دهد. این توانایی، NOVA را به مجریای تبدیل میکند که نهتنها به پرسوجوهای مخاطبان پاسخ میدهد، بلکه میتواند محتوای مرتبط با موضوعات روز را بهصورت خودکار تولید کند. این ویژگی برای پلتفرمهای پخش زنده، مانند استریمینگ یا تجارت الکترونیک، ارزشی بیمانند دارد، زیرا تعامل با مخاطب را پویاتر و جذابتر میکند.
سومین و شاید جذابترین ویژگی، فناوری شبیهسازی سریع چهره و صدا است. NOVA میتواند تنها با ۱۰ دقیقه ویدیوی نمونه از یک فرد، آواتاری دیجیتال با دقت فوقالعاده خلق کند که صدا، تُن صحبت و حتی زبان بدن او را تقلید میکند. این امکان نهتنها برای ایجاد مجریهای مجازی بلکه برای شخصیسازی آواتارها در حوزههای مختلف مانند آموزش، سرگرمی یا حتی تبلیغات بسیار کاربردی است. تصور کنید یک اینفلوئنسر بتواند نسخه دیجیتالی خود را برای تولید محتوای ۲۴ ساعته ایجاد کند، بدون اینکه نیازی به حضور فیزیکی داشته باشد!
نتایج اولیه این فناوری بسیار امیدوارکننده بوده است. طبق گزارش Seekingalpha، استفاده از انسانهای دیجیتال بایدو در یک پلتفرم آموزشی، زمان تماشای ویدیوهای یک اینفلوئنسر را ۱۰۱ درصد افزایش داده است. این موفقیت نشان میدهد که آواتارهای دیجیتال نهتنها میتوانند جایگزین مجریهای انسانی شوند، بلکه در برخی موارد عملکرد بهتری نیز ارائه میدهند. در حال حاضر، بیش از ۱۰۰ هزار کسبوکار در چین، از فناوری انسان دیجیتال بایدو در حوزههایی مانند تجارت الکترونیک، آموزش، سلامت و حقوق استفاده میکنند. این استقبال گسترده، نشانهای از پتانسیل بالای NOVA برای تحول در این صنایع است.
با این حال، این فناوری چالشهایی نیز به همراه دارد. جایگزینی مجریهای انسانی با آواتارهای دیجیتال ممکن است نگرانیهایی درباره از دست رفتن مشاغل ایجاد کند، بهویژه در صنایعی که به حضور انسانی وابستهاند. همچنین، مسائل اخلاقی مانند استفاده از شبیهسازی چهره و صدای افراد بدون رضایت کامل یا سوءاستفاده از این فناوری برای تولید محتوای جعلی، از جمله موضوعاتی هستند که باید با دقت مدیریت شوند. بایدو اعلام کرده که در حال توسعه پروتکلهایی برای تضمین استفاده مسئولانه از NOVA است، اما موفقیت این اقدامات هنوز در هالهای از ابهام قرار دارد.