هدفونی که مترجم همزمان چند کاربر می شود – خبرگزاری هاریکا | اخبار ایران و جهان

هدفونی که مترجم همزمان چند کاربر می شود - خبرگزاری مهر | اخبار ایران و جهان

به گزارش خبرگزاری هاریکا به نقل از اینترستینگ انجینرینگ، محققان دانشگاه واشنگتن یک سیستم جدید به نام «ترجمه گفتار فضایی» (Spatial Speech Translation) را توسعه داده‌اند که با استفاده از هدفون‌های ضد صوت موجود در بازار و میکروفون‌های مجهز به آن‌ها ساخته شده است.

این سیستم با استفاده از الگوریتم‌های پیشرفته، توانایی جداسازی سخنگویان مختلف در یک محیط و پیگیری حرکات آن‌ها را دارد. سپس، این سیستم سخنان هر فرد را ترجمه کرده و با تاخیری بین دو تا چهار ثانیه، آن را دوباره پخش می‌کند. شیام گولاکوتا، نویسنده ارشد این پژوهش، بیان کرد که سایر فناوری‌های ترجمه معمولاً بر این فرض بنا شده‌اند که تنها یک فرد در حال صحبت است. اما در واقعیت، یک صدای روباتیک نمی‌تواند به جای چند نفر در یک اتاق صحبت کند. این سیستم برای نخستین بار توانسته صدای هر فرد و جهتی که صدا از آن می‌آید را حفظ کند.

محققان همچنین اعلام کردند که این سیستم دارای سه نوآوری اصلی است. نخستین نوآوری آن است که به محض روشن شدن، به‌طور لحظه‌ای تعداد افرادی که در یک فضای بسته یا باز صحبت می‌کنند را شناسایی می‌کند. توچائو چن، رهبر پروژه، توضیح داد که الگوریتم‌های طراحی شده مانند رادار عمل می‌کنند و فضای اطراف را به‌طور ۳۶۰ درجه اسکن کرده و به‌طور مداوم تعداد افرادی که در حال صحبت هستند را شناسایی و به‌روزرسانی می‌کنند.

این سیستم وقتی بر روی دستگاه‌های موبایل با تراشه M۲ اپل مانند لپ‌تاپ یا اپل ویژن پرو فعال می‌شود، گفتار را ترجمه کرده و ویژگی‌های بیانی و بلندی صدای هر فرد را حفظ می‌کند. همچنین، محققان به دلیل نگرانی‌های حریم خصوصی مربوط به نسخه‌برداری از صدا، از ابر رایانشی استفاده نکرده‌اند.

این سیستم همچنین می‌تواند هنگام تکان دادن سر افراد، جهت و ویژگی‌های صوتی آن‌ها را ردیابی کند.

Picture of هاریکا

هاریکا

هاریکا، به‌عنوان مجله‌ای نوآوری و مدرن در دنیای تکنولوژی، فعالیت خود را با هدف ارائه دقیق‌ترین و به‌روزترین اخبار، تحلیل‌ها و بررسی‌های فناوری آغاز کرده است. ما باور داریم که تکنولوژی فراتر از یک ابزار است؛ این یک سبک زندگی است که هر روز، جنبه‌های مختلف زندگی ما را دگرگون می‌کند. هاریکا، از ترکیب شور و تخصص در دنیای دیجیتال متولد شده است. تیم ما شامل گروهی از نویسندگان، تحلیل‌گران و علاقه‌مندان به فناوری است که هدفشان ارائه محتوایی جذاب، قابل اعتماد و کاربرپسند به شماست.

مقالات مرتبط

ویدیو وال چیست؟

ویدیو وال ها به عنوان پلتفرم های ارتباطی قدرتمند، در بخش های…

بهترین سایت‌های آموزش برنامه‌نویسی در ایران

برنامه‌نویسی امروزه به یکی از پرطرفدارترین و پردرآمدترین مهارت‌های دنیای دیجیتال تبدیل…

نوت بوک ال ام (NotebookLM): ۵ تکنیک تبدیل نوت بوک ال ام به مغز دوم!

با عمومی شدن هوش مصنوعی دیگر بزرگ‌ترین چالش بسیاری از ما، کمبود…

1404-10-02