محققان دانشگاه واشنگتن یک سیستم هدفون پیشرفته توسعه دادهاند که قادر است گفتار چندین سخنران را همزمان ترجمه کرده و ویژگیهای صدای هر یک را حفظ کند. این سیستم با نام "ترجمه گفتار فضایی" طراحی شده و از هدفونهای نویزکنسلینگ معمولی با میکروفنهای خاص بهره میبرد.
به گزارش اینترستینگ انجینیرینگ، سیستم جدید از الگوریتمهای پیشرفتهای استفاده میکند که توانایی جداسازی و دنبال کردن صدای سخنرانان مختلف در یک فضا را دارد. این سیستم میتواند صدای هر سخنران را شبیهسازی کرده و آن را ترجمه کند و با تأخیری ۲ تا ۴ ثانیهای پخش کند.
یکی از نوآوریهای این سیستم، تشخیص تعداد سخنرانان حاضر در یک فضای داخلی یا خارجی است. هنگامی که سیستم روشن میشود، به طور خودکار تعداد افراد حاضر را شناسایی کرده و به صورت ۳۶۰ درجه فضای اطراف را اسکن میکند. همچنین این سیستم توانایی پیگیری حرکت سخنرانان و حفظ ویژگیهای صدای آنها حتی در هنگام تغییر جهت سر را دارد.
این سیستم توانسته است در آزمایشهایی که در ۱۰ محیط مختلف انجام شده، عملکرد موفقی از خود نشان دهد. در یک آزمایش با ۲۹ شرکتکننده، این سیستم نسبت به مدلهایی که نتواستند سخنرانان را در حرکت دنبال کنند، مورد ترجیح قرار گرفت.
محققان این سیستم را به عنوان یک مفهوم نوآورانه در زمینه ترجمه گفتار فضایی معرفی کردهاند که قادر است صدای سخنرانان مختلف را به طور همزمان ترجمه کرده و ویژگیهای صوتی آنها را حفظ کند. این سیستم علاوه بر ترجمه، قادر است کیفیت صدا و جهت صدای هر سخنران را نیز در خروجی binaural (دوگوشی) حفظ نماید.
این سیستم در حال حاضر قادر به ترجمه گفتارهای معمولی است، اما هنوز برای زبانهای تخصصی مانند اصطلاحات فنی طراحی نشده است. محققان از زبانهای اسپانیایی، آلمانی و فرانسوی برای آزمایش این سیستم استفاده کردهاند و نشان دادهاند که این سیستم میتواند به راحتی به ۱۰۰ زبان مختلف ترجمه کند.
تیم تحقیقاتی در حال کار بر روی کاهش تأخیر در فرآیند ترجمه است و در نسخههای آینده به دنبال بهبود سرعت سیستم هستند. این دستاورد علمی نشاندهنده پیشرفتهای چشمگیر در استفاده از هوش مصنوعی و فناوریهای شبیهسازی صدا در حوزه ترجمه و ارتباطات بینالمللی است.
انتهای پیام/