شنبه ۱۸ آذر ۱۴۰۲ - ۰۶:۴۰ شناسهٔ خبر: 63935437 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: جام‌جم آنلاین | لینک خبر

هر آنچه باید در مورد رقیب جدید «چت جی‌پی‌تی» بدانید

شرکت گوگل به تازگی از قدرتمندترین مدل هوش مصنوعی خود به «جمنای» (Gemini) رونمایی کرده است، اما این هوش مصنوعی چیست و چه کار‌هایی می‌تواند انجام دهد؟

به گزارش جام جم آنلاین، هوش مصنوعی جدید شرکت گوگل به تازگی رونمایی و عرضه شده است و وقت آن رسیده تا بیشتر با این رقیب چت جی‌پی‌تی آشنا شویم.

گوگل جمنای چیست؟

جمنای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که می‌تواند نه تنها متن، بلکه تصاویر، ویدئو‌ها و صدا‌ها را نیز درک کند. به عنوان یک مدل چندوجهی، جمنای قادر به انجام وظایف پیچیده‌ای در حوزه ریاضیات، فیزیک و سایر زمینه‌ها و همچنین درک و تولید کد با کیفیت بالا در زبان‌های برنامه‌نویسی مختلف است.

در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل بارد (Google Bard) و تلفن همراه هوشمند گوگل پیکسل (Google Pixel ۸) ادغام شده است، اما به تدریج در سایر سرویس‌های گوگل نیز قرار خواهد گرفت.

به گفته دنیس حسابیس (Dennis Hassabis)، مدیرعامل و یکی از بنیانگذاران گوگل دیپ‌مایند، جمنای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل (Google Research) است. این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این بدان معناست که می‌تواند موارد مختلف را به هم تعمیم دهد و به طور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.

چه کسی جمنای را ساخته است؟

جمنای توسط گوگل و آلفابت که شرکت مادر گوگل است، ایجاد شد و به عنوان پیشرفته‌ترین مدل هوش مصنوعی این شرکت تا به امروز منتشر شد. گوگل دیپ مایند نیز سهم قابل توجهی در توسعه جمنای داشته است.

آیا چندین نسخه مختلف از جمنای وجود دارد؟

گوگل جمنای را به عنوان یک مدل انعطاف‌پذیر توصیف می‌کند که می‌تواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاه‌های تلفن همراه اجرا شود. برای دستیابی به این انعطاف‌پذیری، جمنای در سه نسخه عرضه می‌شود: نانوجمنای (Gemini Nano)، پروجمنای (Gemini Pro) و اولترا جمنای (Gemini Ultra).

نانو جمنای

اندازه مدل نانو جمنای برای اجرا بر روی تلفن‌های همراه هوشمند، به‌ویژه گوگل پیکسل ۸ (Google Pixel ۸) طراحی شده است. این مدل برای انجام کار‌ها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرور‌های خارجی دارد، مانند ارائه پیشنهاد برای پاسخ در برنامه‌های چت یا خلاصه کردن متن ساخته شده است.

پرو جمنای

پرو جمنای که در مراکز داده گوگل اجرا می‌شود، برای تامین آخرین نسخه چت‌بات هوش مصنوعی این شرکت یعنی بارد (Bard)، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.

اولترا جمنای

اگرچه اولترا جمنای هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف می‌کند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدل‌های زبانی بزرگ (LLM) فراتر رفته است. این هوش مصنوعی برای کار‌های بسیار پیچیده طراحی شده است و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود.

چگونه می‌توان به جمنای دسترسی پیدا کرد؟

جمنای اکنون در محصولات گوگل در اندازه‌های نانو و پرو، مانند تلفن پیکسل ۸ و چت‌بات بارد، در دسترس است. گوگل قصد دارد جمنای را به مرور در موتور جستجوگر، تبلیغات، کروم و سایر سرویس‌های خود ادغام کند.

توسعه‌دهندگان و مشتریان سازمانی از ۱۳ دسامبر می‌توانند از طریق Gemini API در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به پرو جمنای دسترسی داشته باشند. توسعه‌دهندگان اندروید نیز از طریق AICore به نانوجمنای دسترسی خواهند داشت، که به صورت پیش نمایش اولیه در دسترس خواهد بود.

جمنای چه تفاوتی با سایر مدل‌های هوش مصنوعی مانند جی‌پی‌تی-۴ دارد؟

به نظر می‌رسد که مدل جدید جمنای گوگل یکی از بزرگترین و پیشرفته‌ترین مدل‌های هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدل‌های محبوبی که در حال حاضر چت‌بات‌های هوش مصنوعی را تقویت می‌کنند، جمنای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدل‌های دیگر، مانند جی‌پی‌تی-۴، برای چندوجهی بودن واقعا به اتصالات و ادغام‌ها متکی هستند.

در مقایسه با جی‌پی‌تی-۴ که یک مدل عمدتا مبتنی بر متن است، جمنای به راحتی وظایف چندوجهی را به صورت بومی انجام می‌دهد. در حالی که جی‌پی‌تی‌-۴ در کار‌های مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات اُپن‌ای‌آی (OpenAI) متوسل می‌شود و برای تولید تصاویر و پردازش صدا به DALL-E ۳ و ویسپر (Whisper) متکی است.

همچنین به نظر می‌رسد جمنای گوگل بیشتر از سایر مدل‌های موجود در حال حاضر بر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت می‌بخشد. مدل‌های دیگر، مانند جی‌پی‌تی-۴ و Meta's Llama، بیشتر سرویس‌گرا هستند و برای برنامه‌ها، ابزار‌ها و خدمات توسعه‌دهندگان مختلف شخص ثالث در دسترس قرار دارند.

∎