شناسهٔ خبر: 76300222 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: ایرنا | لینک خبر

هدفون هوشمند، گفت‌وگو در محیط پرسروصدا را آسان می‌کند

تهران- ایرنا- اگر تا به حال در یک محیط شلوغ برای شنیدن صحبت‌های فرد مقابل خود تقلا کرده‌اید، این فناوری جدید برای شما ساخته شده است: هدفون‌های هوشمندی که با تحلیل الگوی گفت‌وگو، به‌طور خودکار صدای مخاطبان شما را تقویت و سروصدای محیط را حذف می‌کنند.

صاحب‌خبر -

به گزارش گروه علمی ایرنا، وبگاه تِک‌اِکسپلور در گزارشی آورده است:

صحبت‌کردن در محیط‌های شلوغ همواره چالش‌برانگیز بوده است؛ زیرا هنگامی که صداهای اطراف زیاد است، نمی‌توانیم صدای فرد مقابل خود را به‌وضوح بشنویم. این مشکل نه تنها آزاردهنده است، بلکه برای افراد کم‌شنوا می‌تواند به مانعی جدی در ارتباط تبدیل شود.

اکنون پژوهشگران دانشگاه واشینگتن راه‌حلی هوشمندانه برای این مشکل ارائه داده‌اند: هدفون‌های هوشمندی که به طور خودکار صدای افرادی را که با آن‌ها گفت‌وگو می‌کنید، از میان هیاهوی محیط جدا می‌کنند. این فناوری که نیاز به تنظیم دستی ندارد، در آینده می‌تواند در سمعک‌ها، هدفون‌های معمولی و عینک‌های هوشمند نیز به کار رود.

این سامانه چگونه کار می‌کند؟

این سامانه که دستیار شنوایی پیش‌کنشگر (proactive hearing assistants) نام دارد، با شروع صحبت کاربر فعال می‌شود. یک مدل هوش مصنوعی با تحلیل این پرسش که چه کسی و در چه زمانی صحبت کرد؟، الگوی نوبتی گفت‌وگو را شناسایی می‌کند. سپس مدل دوم، صداهای شناسایی‌شده را تقویت و سایر صداهای محیط را حذف یا کمرنگ می‌کند.

شیام گولاکوتا (Shyam Gollakota)، سرپرست این پژوهش، توضیح می‌دهد: روش‌های قبلی نیازمند کاشت الکترود در مغز برای ردیابی توجه شنیداری بودند؛ اما ما دریافتیم که در یک گفت‌وگو، صحبت افراد به طور طبیعی از یک الگوی نوبتی پیروی می‌کند و هوش مصنوعی می‌تواند تنها با تحلیل صدا، این الگو را تشخیص دهد.

آزمایش و نتایج

این سامانه روی ۱۱ نفر آزمایش شد. شرکت‌کنندگان کیفیت صدا را بیش از دو برابر بهتر از حالت عادی ارزیابی کردند و گزارش دادند که درک بهتری از مکالمات در محیط شلوغ دارند.

چالش‌ها و برنامه آینده

با این حال، این فناوری هنوز کامل نیست. هرچه گفت‌وگو پویاتر باشد (مثلاً وقتی افراد هم‌زمان صحبت می‌کنند یا ورود و خروج افراد به گفت‌وگو زیاد است)، عملکرد سامانه با چالش بیشتری مواجه می‌شود. همچنین این مدل فعلاً بر روی گفت‌وگوهای انگلیسی، چینی ماندارین و ژاپنی آزمایش شده و ممکن است برای زبان‌های دیگر نیاز به تنظیم دقیق‌تر داشته باشد.

در حال حاضر این سامانه روی هدفون‌های معمولی موجود در بازار اجرا می‌شود، اما هدف نهایی این است که روی یک تراشه کوچک درون سمعک یا هدفون بی‌سیم قرار گیرد.

این پژوهش در کنفرانس روش‌های تجربی در پردازش زبان طبیعی در چین ارائه شده و کد آن به صورت منبع‌باز در دسترس عموم قرار دارد. مقاله کامل نیز در پایگاه آرکایو/ arXiv منتشر شده است.