پنجشنبه ۹ اسفند ۱۴۰۳ - ۱۱:۰۵ شناسهٔ خبر: 71601218 - سرویس اجتماعی
نسخه قابل چاپ منبع: آنا | لینک خبر

پردازش هم‌زمان متن، تصویر و گفتار در محصولات جدید مایکروسافت

مایکروسافت از مدل‌های جدید هوش مصنوعی Phi-۴ رونمایی کرده که می تواند متن، تصویر و گفتار را پردازش کند.

به گزارش خبرگزاری آنا؛ مایکروسافت از مدل‌های جدید هوش مصنوعی Phi-۴ رونمایی کرده که قادر به پردازش هم‌زمان متن، تصویر و گفتار هستند و درعین‌حال به قدرت پردازشی کمتری نسبت به مدل‌های مشابه نیاز دارند.

مدل Phi-۴-Multimodal با ۵.۶ میلیارد پارامتر و مدل Phi-۴-Mini با ۳.۸ میلیارد پارامتر، با وجود اندازه کوچک‌تر، عملکردی قابل‌رقابت با مدل‌های دو برابر بزرگ‌تر از خود دارند.

ویژ‌گی شاخص Phi-۴-Multimodal توانایی پردازش چندوجهی آن است که به لطف تکنیک جدید «ترکیب LoRAs» امکان‌پذیر شده است.

این رویکرد باعث می‌شود مدل بتواند بدون افت عملکرد، به‌طور هم‌زمان ورودی‌های متنی، تصویری و صوتی را پردازش کند. مدل Phi-۴-Mini نیز با وجود اندازه کوچک خود، توانایی بالایی در وظایف متنی دارد.

مایکروسافت این مدل‌ها را از طریق Azure AI Foundry، Hugging Face و Nvidia API Catalog در دسترس قرار داده تا توسعه‌دهندگان بتوانند به‌راحتی از آنها در پروژه‌های خود استفاده کنند.

انتهای پیام/

∎