هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر – هاریکا

هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر


به گزارش هاریکا به نقل از فارس به نقل از اینترستینگ انجینیرینگ، هدفون ترجمه هم‌زمان که توسط محققان دانشگاه واشنگتن ابداع شده، ترجمه گفتار فضایی نام دارد و مجهز به نویزگیر برای حذف صدا‌های مزاحم و نیز میکروفون است.

الگوریتم‌های هوش مصنوعی این هدفون، صدای گویندگان مختلف را که در یک فضا قرار دارند، جدا کرده و آنها را در حین حرکت دنبال می‌کند، گفتار آنها را ترجمه کرده و با تأخیر ۲ تا ۴ ثانیه‌ای پخش می‌کند.

شیام گولاکوتا، نویسنده ارشد و استاد دانشگاه واشنگتن در دانشکده علوم کامپیوتر در این مورد گفت: سایر فناوری‌های ترجمه هم‌زمان مبتنی بر این فرض هستند که فقط یک نفر در حال صحبت‌کردن است. اما در دنیای واقعی، نمی‌توانید فقط یک‌صدای رباتیک داشته باشید که برای چندین نفر در یک اتاق صحبت کند. برای اولین بار، ما صدای هر فرد و جهت دریافت صدا را شناسایی و در حین ترجمه هم‌زمان به این امر توجه کرده‌ایم.

این دستگاه دارای چند نوع نوآوری است. وقتی این هدفون روشن می‌شود، بلافاصله تشخیص می‌دهد که چند گوینده در یک فضای داخلی یا خارجی وجود دارد. زیرا الگوریتم‌های آنها کمی شبیه رادار کار می‌کنند؛ بنابراین فضا را به‌صورت ۳۶۰ درجه اسکن می‌کند و دائماً تعیین می‌کند که آیا یک نفر یا شش یا هفت نفر در محیط وجود دارند و این اطلاعات را به‌روزرسانی می‌کند.

این دستگاه سپس گفتار را ترجمه می‌کند و کیفیت بیان و بلندی صدای هر گوینده را هنگام ترجمه و پخش از طریق دستگاه‌هایی مانند دستگاه‌های تلفن همراه مجهز به تراشه‌ام ۲ شرکت اپل، لپ‌تاپ‌ها و هدست اپل ویژن پرو حفظ می‌کند.

سازندگان این هدفون به دلیل نگرانی‌های مربوط به حفظ حریم خصوصی در زمان شبیه‌سازی صدای هر فرد، از استفاده از فناوری محاسبات ابری خودداری کردند.

در نهایت، هنگامی که گوینده‌ها سر خود را حرکت می‌دهند، سیستم نیز جهت و کیفیت صدای آنها را با تغییر جهت سر آنها ردیابی می‌کند. این سیستم با موفقیت در ۱۰ محیط داخلی و خارجی فعال شده و در یک آزمایش با ۲۹ شرکت‌کننده، کاربران این سیستم را نسبت به مدل‌هایی که گوینده‌ها را در فضا ردیابی نمی‌کردند، برای ترجمه هم‌زمان ترجیح دادند.

فناوری ترجمه فضایی گفتار محققان، مفهومی نوین برای دستگاه‌های شنیداری است که صدای گویندگان را در محیط کاربری ترجمه می‌کند و درعین‌حال جهت و ویژگی‌های منحصر‌به‌فرد صدای هر گوینده را در زمان پخش از طریق خروجی هدفون حفظ می‌کند.

این سیستم در حال حاضر تنها قادر به ترجمه گفتار روزمره است و برای ترجمه زبان تخصصی و اصطلاحات فنی دقت لازم را ندارد. ترجمه هم‌زمان از زبان‌های اسپانیایی، آلمانی و فرانسوی به انگلیسی با موفقیت انجام شده و در آینده نزدیک می‌توان آن را برای ترجمه از حدود ۱۰۰ زبان آموزش داد.

Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

اعلاشویی در قالیشویی: اصطلاح تبلیغاتی یا یک فرایند استاندارد؟

امروزه با گذشت بیش از چهار دهه از انتقال تدریجی فرآیند شستشوی…

1405-04-01

5 نکته کلیدی برای انتخاب اسکرابر صنعتی مناسب کسب و کار شما

مدیریت نظافت فضاهای تجاری و سالن های تولیدی در سال های اخیر…

1405-03-30

هزینه ارسال بار با وانت در ۱۴۰۶ چقدر می‌شود؟ برخی مسیرها به ۱۲ میلیون تومان رسید

چه شما یک راننده زحمت‌کش باشید که می‌خواهید بدانید برای مسیرهای پیش…

1405-03-10