شناسهٔ خبر: 69944291 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: برنا | لینک خبر

هوش‌مصنوعی آهنگساز هم شد!

انویدیا از مدل هوش‌مصنوعی جدید خود برای تولید صدا رونمایی کرد. انویدیا از مدل هوش‌مصنوعی جدید خود برای تولید صدا رونمایی کرد.

صاحب‌خبر -

به گزارش خبرنگار علم و فناوری خبرگزاری برنا، انویدیا اخیرا از یک مدل هوش‌مصنوعی جدید به نام Fugatto رونمایی کرد. این مدل از نوع Foundational Generative Audio Transformer Opus ۱ بوده و قادر است دستوراتی که به صورت متن وارد می‌شوند را برای تولید یا تغییر فایل‌های صوتی، موسیقی، صدا و گفتار به کار بگیرد.

این مدل توسط تیمی از محققان هوش‌مصنوعی از سراسر جهان طراحی شده است و انویدیا اعلام کرده که قابلیت‌های چند لهجه‌ای و چند زبانه آن را تقویت کرده است.

رافائل ولی، یکی از محققان پشت این پروژه و مدیر تحقیقات کاربردی صدا در انویدیا گفت: ما می‌خواستیم مدلی بسازیم که صدا را همانطور که انسان‌ها درک و تولید می‌کنند، بفهمد و ایجاد کند. 

این مدل کاربرد‌های مختلفی در دنیای واقعی دارد که انویدیا در بیانیه خود به برخی از آن‌ها اشاره کرده است. به عنوان مثال، تولیدکنندگان موسیقی‌ می‌توانند از این فناوری برای ایجاد سریع نمونه‌های اولیه از ایده‌های موسیقی استفاده کنند و سپس آنها را به راحتی ویرایش کرده و سبک‌ها، صدا‌ها و ساز‌های مختلف را آزمایش کنند. همچنین، افراد می‌توانند از این مدل برای ایجاد محتوای آموزشی زبان با صدای دلخواه خود استفاده کنند. توسعه‌دهندگان بازی‌های ویدئویی نیز می‌توانند از آن برای ایجاد و تغییر نسخه‌های مختلف از فایل‌های صوتی پیش‌ساخته به منظور تطبیق با انتخاب‌ها و اقدام‌های بازیکنان در بازی‌ها استفاده کنند.

از دیگر ویژگی‌های جالب این مدل، توانایی آن در انجام کار‌هایی است که در فرآیند آموزش اولیه آن قرار نداشته است. به عنوان مثال، مدل قادر است با کمی تنظیم مجدد، دستوراتی مانند تولید گفتار خشمگین با لهجه خاص یا صدای پرندگان در حال آواز خواندن در طول یک طوفان رعد و برق را ایجاد کند. Fugatto همچنین توانایی تولید صدا‌هایی دارد که در طول زمان تغییر می‌کنند، مانند صدای باران که با حرکت خود بر روی زمین تغییر می‌کند.

انویدیا در حال حاضر اشاره‌ای نکرده است که آیا این مدل را در دسترس عموم قرار خواهد داد یا خیر. با این حال، Fugatto نخستین فناوری هوش‌مصنوعی برای تولید صدا از طریق دستورات متنی نیست.

پیش از این، متا یک کیت هوش‌مصنوعی متن‌باز منتشر کرده بود که می‌تواند صدا‌هایی را از توصیفات متنی تولید کند و گوگل نیز دارای فناوری هوش‌مصنوعی خاص خود به نام MusicLM است که کاربران می‌توانند از طریق وب‌سایت آزمایشی "AI Test Kitchen" به آن دسترسی پیدا کنند.

انتهای پیام/

برچسب‌ها: