مدل هوش مصنوعی جمینای ۳ و سکوی آنتیگراویتی رونمایی شدند
روز گذشته نسل سوم مدلهای هوش مصنوعی گوگل با تمرکز بر قابلیتهای استدلال قوی، کاهش خطا در تولید محتوا و امکان ایجاد رابطهای کاربری گرافیکی پویا به همراه یک محیط توسعه نرمافزار جدید معرفی کرد.
صاحبخبر - به گزارش خبرگزاری آنا؛ نسخه جدید مدل زبانی گوگل یعنی جمینای ۳ پرو شش ماه پس از عرضه خانواده جمینای ۲.۵ در دسترس کاربران و توسعهدهندگان قرار گرفته است. این بهروزرسانی شامل بهبود عملکرد در بنچمارکهای ریاضی و برنامهنویسی، کاهش پاسخهای نادرست و معرفی قابلیتهای عاملیت برای انجام مستقل وظایف در محیطهای دیجیتال است.
گوگل همزمان با این مدل، سکو آنتیگراویتی را نیز عرضه کرده که یک محیط توسعه یکپارچه متمرکز بر هوش مصنوعی است و امکان مدیریت چندین عامل هوشمند برای کدنویسی و اجرای پروژه را فراهم میکند. طبق اعلام این شرکت، تمرکز اصلی در این نسخه تغییر رویکرد از پردازش متن به درک موقعیت و انجام کنشهای چندمرحلهای است.
سوندار پیچای، مدیرعامل گوگل و آلفابت، این مدل را هوشمندترین دستاورد شرکت تا به امروز توصیف کرده که برای درک عمق و ظرافت مسائل طراحی شده است. دسترسی به این مدلها از امروز برای توسعهدهندگان و کاربران سازمانی فعال شده است.
مشخصات فنی و عملکرد در آزمونهای استاندارد
دادههای منتشر شده توسط گوگل نشان میدهد مدل جمینای ۳ در شاخصهای ارزیابی هوش مصنوعی نسبت به نسل قبل تغییرات مشخصی داشته است. این مدل در ردهبندی LMArena که به مقایسه مدلهای زبانی میپردازد، امتیاز ۱۵۰۱ را کسب کرده است. این امتیاز ۵۰ واحد بیشتر از امتیاز مدل جمینای ۲.۵ پرو است. همچنین در آزمون humanity’s Last Exam که سوالات سطح دکترا در حوزههای مختلف علمی را شامل میشود، جمینای ۳ بدون استفاده از ابزارهای جانبی به امتیاز ۳۷.۵ درصد دست یافته است. گوگل اعلام کرده نسخه آزمایشی دیگری با نام Deep Think که روی استدلال عمیق تمرکز دارد، در همین آزمون به امتیاز ۴۱ درصد رسیده است. این نسخه هنوز به صورت عمومی عرضه نشده و در مرحله تست ایمنی قرار دارد.
بررسی دقت و صحت اطلاعات در مدل جدید اولویت داشته است. جمینای ۳ در آزمون SimpleQA Verified که میزان درستی پاسخهای واقعی را میسنجد، امتیاز ۷۲.۱ درصد را ثبت کرد. این عدد نشان میدهد که مدل در حدود ۲۸ درصد موارد همچنان احتمال خطا یا ارائه اطلاعات نادرست دارد، اما گوگل این نتیجه را پیشرفتی نسبت به مدلهای قبلی میداند.
مدل در بخش ریاضیات، در بنچمارک MathArena Apex امتیاز ۲۳.۴ درصد را کسب کرد. در حوزه برنامهنویسی و توسعه وب نیز امتیاز مدل در تست WebDev Arena به ۱۴۸۷ رسید. همچنین در بنچمارک SWE-bench Verified که توانایی مدل در حل مسائل مهندسی نرمافزار و تولید کد را بررسی میکند، جمینای ۳ موفق به ثبت امتیاز ۷۶.۲ درصد شده است.
سکو توسعه آنتیگراویتی و قابلیتهای کدنویسی
گوگل همزمان با مدل زبانی، ابزار توسعه نرمافزار جدیدی به نام آنتیگراویتی را معرفی کرد. این سکو یک محیط توسعه یکپارچه است که بر پایه تعامل با عاملهای هوشمند طراحی شده است. توسعهدهندگان در این محیط به جای نوشتن کد به صورت دستی، نقش نظارتی بر عاملهای هوش مصنوعی را بر عهده دارند.
این عاملها توانایی دسترسی به ویرایشگر متن، ترمینال سیستمعامل و مرورگر وب را دارند و میتوانند وظایف پیچیده مانند ایجاد فایل، تغییر ساختار پروژه و اجرای تستها را به صورت مستقل انجام دهند. گوگل این محیط را به مرکز کنترل ماموریت تشبیه کرده است که در آن کاربر وظایف را تعیین و بر خروجی عاملها نظارت میکند.
ساختار آنتیگراویتی محدود به مدلهای گوگل نیست. طبق اطلاعات منتشر شده، این سکو از مدلهای شرکتهای دیگر مانند کلود ۴.۵ و مدلهای متنباز GPT-OSS نیز پشتیبانی میکند. این ویژگی به توسعهدهندگان اجازه میدهد از مدلهای مختلف برای بخشهای متفاوت پروژه استفاده کنند.
فعالیت عاملهای هوشمند در این محیط در قالب واحدهایی به نام Artifacts به کاربر نمایش داده میشود تا فرآیند بررسی و تایید کدها انجام شود. همچنین جمینای ۳ دارای قابلیت تولید دستورات Bash در سمت کلاینت است که امکان مدیریت فایلها و خودکارسازی عملیات سیستمعامل را فراهم میکند. نسخه پیشنمایش آنتیگراویتی از امروز برای سیستمعاملهای ویندوز، مک و لینوکس در دسترس قرار گرفته است.
رابط کاربری مولد و تغییر در نحوه جستوجو
قابلیت جدید رابط کاربری مولد در جمینای ۳ نیز معرفی شده است. این فناوری به مدل اجازه میدهد پاسخ کاربر را به جای متن، در قالب رابطهای گرافیکی تعاملی ارائه دهد. این ویژگی شامل دو حالت Visual Layout برای نمایش محتوا شبیه به مجله و Dynamic View برای ساخت ابزارهای کاربردی است. در یک نمونه عملی، علی اسلامی از پژوهشگران شرکت دیپمایند درباره نحوه عملکرد حملات سایبری DDoS سوال پرسیده و مدل به جای توضیح متنی، یک شبیهساز گرافیکی از حمله را کدنویسی و اجرا کرده است.
دانلود فیلم اصلی کد ویدیو
در نمونهای دیگر، برای معرفی ونسان ونگوک، یک وباپلیکیشن تعاملی شامل آثار و زندگینامه او توسط مدل ساخته شد.
ادغام جمینای ۳ با موتور جستجوی گوگل نیز تغییراتی را ایجاد کرده است. گزینه AI Mode در بخش جستوجو بروزرسانی شده است و برای پاسخ به سوالات پیچیده از توانایی استدلال جمینای ۳ استفاده میکند.
این حالت قابلیت ایجاد نمودارها و ابزارهای تعاملی را مستقیماً در صفحه نتایج جستوجو دارد. گوگل اعلام کرده است که این ویژگی در حال حاضر فقط برای مشترکین سرویسهای پرمیوم اولترا و پرو فعال است و برای جستوجوهای عمومی از نسخه استاندارد استفاده میشود. استفاده از جمینای ۳ در بخش جستوجو به دلیل نیاز به منابع پردازشی بالا، فعلاً محدود به کاربردهای خاص است.
دانلود فیلم اصلی کد ویدیو
کاهش تملق و افزایش ایمنی در پاسخگویی
مسئله چاپلوسی در مدلهای زبانی یکی از چالشهای فنی بوده است. این پدیدهای است که در آن هوش مصنوعی برای جلب رضایت کاربر، با نظرات اشتباه او موافقت میکند یا پاسخها را با لحنی بیش از حد تاییدکننده ارائه میدهد. گوگل اعلام کرده در جمینای ۳ تنظیمات مدل به گونهای تغییر یافته که پاسخها مختصرتر و مبتنی بر واقعیت باشند و از تایید بیدلیل نظرات کاربر خودداری شود.
این تغییر با هدف افزایش کاربرد حرفهای مدل و جلوگیری از تقویت باورهای غلط کاربر انجام شده است. در همین راستا، دمیس هاسابیس، مدیرعامل دیپمایند در پستی وبلاگی تاکید کرد که پاسخهای جمینای ۳ هوشمند، مختصر و صریح طراحی شدهاند تا به جای تملق و کلیشه، بینش واقعی ارائه دهند. به گفته مدیران ارشد گوگل، این مدل قرار است یک شریک فکری واقعی باشد و آنچه را که نیاز دارید بشنوید به شما بگوید، نه صرفاً آنچه را که دوست دارید بشنوید؛ رویکردی که ضمن کنایه آشکار به مدلهایی نظیر چتجیپیتی، بر کاهش تملق و افزایش صداقت مدل تمرکز دارد.
ایمنی مدل در برابر حملات سایبری و دستکاری دستورات نیز مورد بازبینی قرار گرفته است. جمینای ۳ تحت آزمونهای ایمنی توسط تیمهای داخلی گوگل و نهادهای مستقل مانند Apollo و Vaultis قرار داشته است. این ارزیابیها شامل تست مقاومت در برابر تولید بدافزار، ارائه دستورالعملهای خطرناک و نشت اطلاعات بوده است. با این حال، نسخه Deep Think به دلیل توانایی بالاتر در استدلال و احتمال بروز رفتارهای پیشبینی نشده، همچنان در مرحله بررسی محدود توسط متخصصان ایمنی باقی مانده و زمان دقیق عرضه عمومی آن اعلام نشده است.
وضعیت عرضه و دسترسی
انتشار جمینای ۳ پرو از تاریخ ۲۷ آبان آغاز شده است. این مدل از طریق سرویسهای ابری Vertex AI، محیط گوگل AI Studio و اپلیکیشن رسمی جمینای در دسترس کاربران قرار دارد. توسعهدهندگان میتوانند از طریق API به این مدل متصل شوند. محیط توسعه آنتیگراویتی نیز به صورت نسخه پیشنمایش عمومی عرضه شده است.
گوگل برنامه دارد در آینده مدلهای دیگری از خانواده جمینای ۳ را با ابعاد و تواناییهای متفاوت عرضه کند، اما در حال حاضر فقط نسخه پرو و ابزارهای مرتبط با آن فعال هستند. مشترکین سرویس گوگل AI Ultra اولویت دسترسی به قابلیتهای آزمایشی مانند Deep Think را خواهند داشت.
انتهای پیام/∎