در کنگره جهانی موبایل، گوگل تأیید کرد که قابلیت جدیدی از هوش مصنوعی Gemini که اولینبار نزدیک به یک سال پیش معرفی شد، اکنون آماده عرضه است. این قابلیت که با نامGemini Live شناخته میشود، بهزودی امکان مشاهده ویدئو زنده و اشتراکگذاری صفحه نمایش را خواهد داشت. این ویژگی که پیشتر در قالب پروژه Astra به نمایش گذاشته شده بود، به کاربران اجازه میدهد بهجای توصیف مسائل، آنها را مستقیماً از طریق دوربین به هوش مصنوعی نشان دهند.
در حال حاضر، هوش مصنوعی چندوجهی (Multimodal) گوگل قادر به پردازش متن، تصاویر و انواع مختلف اسناد است. اما قابلیت پردازش ویدئو همچنان محدود است و عملکرد آن در خلاصهسازی ویدئوها، مانند محتوای YouTube، ناپایدار بوده است. با این حال، گوگل اعلام کرده که تا پایان ماه مارس، اپلیکیشن Gemini در اندروید یک بهروزرسانی مهم دریافت خواهد کرد که امکان استفاده از دوربین برای نمایش ویدئو زنده یا اشتراکگذاری صفحه نمایش در زمان واقعی را فراهم میکند. کاربران میتوانند در حین فیلمبرداری، سؤالات خود را از Gemini بپرسند و پاسخ بگیرند.
Google به دنبال تبدیل Gemini به یک “دستیار واقعی”
نمایش اولیه Project Astra در رویداد Google I/O 2024 توجه زیادی را به خود جلب کرد، زیرا شیوهای طبیعیتر برای تعامل با هوش مصنوعی را نشان داد. در آن ویدئو، Gemini Live توانست در حین حرکت دوربین در یک اتاق، به سؤالات کاربر پاسخ دهد، کدهای روی صفحه نمایش را تفسیر کند، عملکرد بلندگوها را توضیح دهد و حتی به کاربر یادآوری کند که عینک خود را کجا گذاشته است.
بااینحال، هنوز مشخص نیست که نسخهای که به اپلیکیشن Gemini اضافه خواهد شد، تا چه اندازه به عملکرد نسخه نمایشی گوگل نزدیک باشد. گوگل ادعا کرده که این بهروزرسانی برای پلتفرم Gemini 2.0، این مدل هوش مصنوعی را به یک “دستیار واقعی” تبدیل خواهد کرد. این شرکت پیشنهاد میدهد که کاربران میتوانند در حین گردش در مکانهای جدید یا خرید آنلاین لباس با کمک اشتراکگذاری صفحه نمایش، با Gemini مکالمهای تعاملی داشته باشند.
نسخه پیشرفته Gemini Live اواخر این ماه در اپلیکیشن Gemini برای گوشیهای اندرویدی منتشر خواهد شد. بااینحال، پردازش ویدئو زنده نیازمند قدرت پردازشی بیشتری نسبت به پردازش متن است و این ویژگی بخشی از Gemini Advanced خواهد بود. برای دسترسی به این قابلیت، کاربران باید اشتراک AI Premium را با هزینه ماهانه ۲۰ دلار تهیه کنند که شامل دسترسی به مدلهای هوش مصنوعی بزرگتر و پیشرفتهتر گوگل نیز میشود.
گوگل در رقابت با OpenAI به دنبال افزایش کاربران است
با وجود هزینه اشتراک، احتمالاً این قابلیت جدید باعث افزایش هزینههای عملیاتی گوگل خواهد شد. تاکنون هیچ شرکتی مدل اقتصادی پایداری برای هوش مصنوعی مولد (Generative AI) پیدا نکرده است و افزودن قابلیت ویدئویی میتواند هزینههای گوگل را افزایش دهد. بااینحال، این قابلیت میتواند تعداد کاربران فعال Gemini را افزایش دهد و به رقابت گوگل با OpenAI کمک کند. در حال حاضر، تعداد کاربران ماهانه Gemini تنها چند ده میلیون نفر است که در مقایسه با ابزارهای OpenAI، اختلاف زیادی دارد.
∎