به گزارش خبرگزاری ایمنا و به نقل از دیورج، مایکروسافت روز پنجشنبه از اولین مدلهای هوش مصنوعی داخلی خود با نامهای MAI-Voice-1 و MAI-1-preview رونمایی کرد. این اقدام، گامی مهم در جهت کاهش وابستگی به OpenAI و توسعه اکوسیستم هوش مصنوعی داخلی این شرکت محسوب میشود. این مدلها مایکروسافت را در موقعیتی قرار میدهند که نه تنها با GPT-5 از OpenAI بلکه با دیگر مدلهای پیشرفته همچون DeepSeek رقابت کند.
نسل جدید تولید صوت با هوش مصنوعی
مدل MAI-Voice-1 یک مدل تولید صوت سریع و باکیفیت است که قادر است در کمتر از یک ثانیه، یک دقیقه صوت با کیفیت بالا تولید کند و تنها به یک GPU نیاز دارد، این ویژگی موجب میشود تا تولید محتوا صوتی با سرعت و کیفیت بالا برای کاربران و کسبوکارها امکانپذیر شود.
مایکروسافت اعلام کرده است که MAI-Voice-1 هماکنون در برخی از قابلیتهای خود همچون Copilot Daily به کار گرفته شده است، جایی که این مدل هوش مصنوعی اخبار مهم روز را برای کاربران بازگو میکند، علاوه بر این، از MAI-Voice-1 برای تولید بحثها و پادکستها با موضوعات مختلف نیز استفاده میشود.
کاربران میتوانند این مدل صوتی را از طریق Copilot و Copilot Labs آزمایش کنند. مایکروسافت تأکید کرده که MAI-Voice-1 قادر است در سناریوهای تکگوینده و چندگوینده عملکرد قابل قبولی ارائه دهد و معتقد است: «صدا، رابط آینده برای همراهان هوش مصنوعی خواهد بود.» این جمله نشان میدهد که مایکروسافت صدا را به عنوان رابط اصلی تعامل با هوش مصنوعی در آینده در نظر گرفته است.
پیشنمایشی از مدلهای متنی آینده
از سوی دیگر، MAI-1-preview به عنوان پیشنمایشی از قابلیتهای آینده در Copilot معرفی شده است. این مدل در حال حاضر به صورت آزمایش عمومی در پلتفرم بنچمارک LMArena در دسترس قرار گرفته است و برای برخی سناریوهای متنی در دستیار هوش مصنوعی Copilot که پیشتر به مدلهای زبانی بزرگ OpenAI وابسته بود، مورد استفاده قرار میگیرد.
مایکروسافت در وبلاگ خود اعلام کرده است: «ما جاهطلبیهای بزرگی برای آینده داریم. نه تنها به دنبال پیشرفتهای بیشتر هستیم، بلکه معتقدیم هماهنگسازی مدلهای تخصصی برای پاسخ به نیازها و موارد مختلف کاربران، ارزش عظیمی ایجاد خواهد کرد.» این اظهارات نشاندهنده تلاش مایکروسافت برای ایجاد یک اکوسیستم هوش مصنوعی یکپارچه و مستقل است.
کاهش وابستگی به OpenAI و تقویت اکوسیستم داخلی
رونمایی از MAI-Voice-1 و MAI-1-preview نشان میدهد که مایکروسافت به دنبال کاهش وابستگی به OpenAI است. با این حال، رابطه بین این دو شرکت همچنان پیچیده باقی مانده است؛ زیرا مایکروسافت شریک اصلی OpenAI و ارائهدهنده انحصاری خدمات ابری آن است، با ارائه مدلهای داخلی، مایکروسافت قادر خواهد بود تا کنترل بیشتری روی فناوریهای کلیدی هوش مصنوعی داشته باشد و در عین حال، با مدلهای خارجی رقابت کند؛ این حرکت میتواند به شرکت کمک کند تا در بازار پررقابت هوش مصنوعی جایگاه قویتری پیدا کند و انعطافپذیری بیشتری در ارائه خدمات به کاربران و کسبوکارها داشته باشد.
کاربردهای مدلهای جدید مایکروسافت
مدلهای جدید مایکروسافت در زمینههای مختلف کاربرد دارند:
- تولید صوت و محتوا: MAI-Voice-1 برای تولید اخبار، پادکستها و محتوای صوتی چندگوینده با کیفیت بالا استفاده میشود.
- مدیریت متن و پاسخگویی هوشمند: MAI-1-preview در دستیار هوش مصنوعی Copilot به کار میرود و میتواند متنهای تخصصی و پاسخهای هوشمند ارائه دهد.
- یکپارچهسازی با خدمات مایکروسافت: این مدلها با سرویسهایی همچون Copilot، Office و سایر پلتفرمهای سازمانی مایکروسافت ادغام میشوند و تجربه کاربری را بهبود میبخشند.
چشمانداز مایکروسافت در هوش مصنوعی
مایکروسافت با رونمایی از MAI-Voice-1 و MAI-1-preview قصد دارد رهبری خود در بازار هوش مصنوعی را تثبیت کند. تمرکز بر مدلهای داخلی نه تنها به این شرکت کمک میکند تا انعطاف بیشتری در ارائه خدمات داشته باشد، بلکه امکان شخصیسازی و بهینهسازی عملکرد مدلها بر اساس نیاز کاربران را نیز فراهم میکند؛ کارشناسان معتقدند که این اقدام میتواند مایکروسافت را به یکی از پیشروان مستقل هوش مصنوعی در جهان تبدیل کند و در عین حال، به رقابت با OpenAI و سایر رقبای جهانی همچون DeepSeek و Anthropic کمک کند.
رونمایی مایکروسافت از MAI-Voice-1 و MAI-1-preview نشاندهنده تغییر استراتژیک در مسیر هوش مصنوعی این شرکت است، با ارائه مدلهای صوتی و متنی داخلی، مایکروسافت نه تنها کنترل بیشتری روی فناوریهای کلیدی خود دارد، بلکه توان رقابتی خود را در برابر مدلهای پیشرفته دیگر افزایش میدهد، این مدلها کاربردهای گستردهای در تولید محتوا، خدمات مشتری و تعاملات صوتی و متنی دارند و میتوانند تجربه کاربران و کسبوکارها را به سطحی حرفهای و هوشمند ارتقا دهند، در نهایت این اقدام مایکروسافت یک گام مهم در ساخت اکوسیستم هوش مصنوعی مستقل و قدرتمند محسوب میشود که میتواند استانداردهای جدیدی در این حوزه ایجاد کند.