چهارشنبه ۲۸ آبان ۱۴۰۴ - ۱۲:۱۲ شناسهٔ خبر: 75898047 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: آنا | لینک خبر

مدل هوش مصنوعی جمینای ۳ و سکوی آنتی‌گراویتی رونمایی شدند

روز گذشته نسل سوم مدل‌های هوش مصنوعی گوگل با تمرکز بر قابلیت‌های استدلال قوی، کاهش خطا در تولید محتوا و امکان ایجاد رابط‌های کاربری گرافیکی پویا به همراه یک محیط توسعه نرم‌افزار جدید معرفی کرد.

صاحب‌خبر - به گزارش خبرگزاری آنا؛ نسخه جدید مدل زبانی گوگل یعنی جمینای ۳ پرو شش ماه پس از عرضه خانواده جمینای ۲.۵ در دسترس کاربران و توسعه‌دهندگان قرار گرفته است. این به‌روزرسانی شامل بهبود عملکرد در بنچمارک‌های ریاضی و برنامه‌نویسی، کاهش پاسخ‌های نادرست و معرفی قابلیت‌های عاملیت برای انجام مستقل وظایف در محیط‌های دیجیتال است. گوگل هم‌زمان با این مدل، سکو آنتی‌گراویتی را نیز عرضه کرده که یک محیط توسعه یکپارچه متمرکز بر هوش مصنوعی است و امکان مدیریت چندین عامل هوشمند برای کدنویسی و اجرای پروژه را فراهم می‌کند. طبق اعلام این شرکت، تمرکز اصلی در این نسخه تغییر رویکرد از پردازش متن به درک موقعیت و انجام کنش‌های چندمرحله‌ای است. سوندار پیچای، مدیرعامل گوگل و آلفابت، این مدل را هوشمندترین دستاورد شرکت تا به امروز توصیف کرده که برای درک عمق و ظرافت مسائل طراحی شده است. دسترسی به این مدل‌ها از امروز برای توسعه‌دهندگان و کاربران سازمانی فعال شده است. مشخصات فنی و عملکرد در آزمون‌های استاندارد داده‌های منتشر شده توسط گوگل نشان می‌دهد مدل جمینای ۳ در شاخص‌های ارزیابی هوش مصنوعی نسبت به نسل قبل تغییرات مشخصی داشته است. این مدل در رده‌بندی LMArena که به مقایسه مدل‌های زبانی می‌پردازد، امتیاز ۱۵۰۱ را کسب کرده است. این امتیاز ۵۰ واحد بیشتر از امتیاز مدل جمینای ۲.۵ پرو است. همچنین در آزمون humanity’s Last Exam که سوالات سطح دکترا در حوزه‌های مختلف علمی را شامل می‌شود، جمینای ۳ بدون استفاده از ابزار‌های جانبی به امتیاز ۳۷.۵ درصد دست یافته است. گوگل اعلام کرده نسخه آزمایشی دیگری با نام Deep Think که روی استدلال عمیق تمرکز دارد، در همین آزمون به امتیاز ۴۱ درصد رسیده است. این نسخه هنوز به صورت عمومی عرضه نشده و در مرحله تست ایمنی قرار دارد. بررسی دقت و صحت اطلاعات در مدل جدید اولویت داشته است. جمینای ۳ در آزمون SimpleQA Verified که میزان درستی پاسخ‌های واقعی را می‌سنجد، امتیاز ۷۲.۱ درصد را ثبت کرد. این عدد نشان می‌دهد که مدل در حدود ۲۸ درصد موارد همچنان احتمال خطا یا ارائه اطلاعات نادرست دارد، اما گوگل این نتیجه را پیشرفتی نسبت به مدل‌های قبلی می‌داند. مدل در بخش ریاضیات، در بنچمارک MathArena Apex امتیاز ۲۳.۴ درصد را کسب کرد. در حوزه برنامه‌نویسی و توسعه وب نیز امتیاز مدل در تست WebDev Arena به ۱۴۸۷ رسید. همچنین در بنچمارک SWE-bench Verified که توانایی مدل در حل مسائل مهندسی نرم‌افزار و تولید کد را بررسی می‌کند، جمینای ۳ موفق به ثبت امتیاز ۷۶.۲ درصد شده است. سکو توسعه آنتی‌گراویتی و قابلیت‌های کدنویسی گوگل هم‌زمان با مدل زبانی، ابزار توسعه نرم‌افزار جدیدی به نام آنتی‌گراویتی را معرفی کرد. این سکو یک محیط توسعه یکپارچه است که بر پایه تعامل با عامل‌های هوشمند طراحی شده است. توسعه‌دهندگان در این محیط به جای نوشتن کد به صورت دستی، نقش نظارتی بر عامل‌های هوش مصنوعی را بر عهده دارند. این عامل‌ها توانایی دسترسی به ویرایشگر متن، ترمینال سیستم‌عامل و مرورگر وب را دارند و می‌توانند وظایف پیچیده مانند ایجاد فایل، تغییر ساختار پروژه و اجرای تست‌ها را به صورت مستقل انجام دهند. گوگل این محیط را به مرکز کنترل ماموریت تشبیه کرده است که در آن کاربر وظایف را تعیین و بر خروجی عامل‌ها نظارت می‌کند. ساختار آنتی‌گراویتی محدود به مدل‌های گوگل نیست. طبق اطلاعات منتشر شده، این سکو از مدل‌های شرکت‌های دیگر مانند کلود ۴.۵ و مدل‌های متن‌باز GPT-OSS نیز پشتیبانی می‌کند. این ویژگی به توسعه‌دهندگان اجازه می‌دهد از مدل‌های مختلف برای بخش‌های متفاوت پروژه استفاده کنند. فعالیت عامل‌های هوشمند در این محیط در قالب واحد‌هایی به نام Artifacts به کاربر نمایش داده می‌شود تا فرآیند بررسی و تایید کد‌ها انجام شود. همچنین جمینای ۳ دارای قابلیت تولید دستورات Bash در سمت کلاینت است که امکان مدیریت فایل‌ها و خودکارسازی عملیات سیستم‌عامل را فراهم می‌کند. نسخه پیش‌نمایش آنتی‌گراویتی از امروز برای سیستم‌عامل‌های ویندوز، مک و لینوکس در دسترس قرار گرفته است. رابط کاربری مولد و تغییر در نحوه جست‌و‌جو قابلیت جدید رابط کاربری مولد در جمینای ۳ نیز معرفی شده است. این فناوری به مدل اجازه می‌دهد پاسخ کاربر را به جای متن، در قالب رابط‌های گرافیکی تعاملی ارائه دهد. این ویژگی شامل دو حالت Visual Layout برای نمایش محتوا شبیه به مجله و Dynamic View برای ساخت ابزار‌های کاربردی است. در یک نمونه عملی، علی اسلامی از پژوهشگران شرکت دیپ‌مایند درباره نحوه عملکرد حملات سایبری DDoS سوال پرسیده و مدل به جای توضیح متنی، یک شبیه‌ساز گرافیکی از حمله را کدنویسی و اجرا کرده است. دانلود فیلم اصلی کد ویدیو

در نمونه‌ای دیگر، برای معرفی ونسان ون‌گوک، یک وب‌اپلیکیشن تعاملی شامل آثار و زندگی‌نامه او توسط مدل ساخته شد. ادغام جمینای ۳ با موتور جستجوی گوگل نیز تغییراتی را ایجاد کرده است. گزینه‌ AI Mode در بخش جست‌و‌جو بروزرسانی شده است و برای پاسخ به سوالات پیچیده از توانایی استدلال جمینای ۳ استفاده می‌کند. این حالت قابلیت ایجاد نمودار‌ها و ابزار‌های تعاملی را مستقیماً در صفحه نتایج جست‌و‌جو دارد. گوگل اعلام کرده است که این ویژگی در حال حاضر فقط برای مشترکین سرویس‌های پرمیوم اولترا و پرو فعال است و برای جست‌و‌جو‌های عمومی از نسخه استاندارد استفاده می‌شود. استفاده از جمینای ۳ در بخش جست‌و‌جو به دلیل نیاز به منابع پردازشی بالا، فعلاً محدود به کاربرد‌های خاص است. دانلود فیلم اصلی کد ویدیو

کاهش تملق و افزایش ایمنی در پاسخگویی مسئله چاپلوسی در مدل‌های زبانی یکی از چالش‌های فنی بوده است. این پدیده‌ای است که در آن هوش مصنوعی برای جلب رضایت کاربر، با نظرات اشتباه او موافقت می‌کند یا پاسخ‌ها را با لحنی بیش از حد تاییدکننده ارائه می‌دهد. گوگل اعلام کرده در جمینای ۳ تنظیمات مدل به گونه‌ای تغییر یافته که پاسخ‌ها مختصرتر و مبتنی بر واقعیت باشند و از تایید بی‌دلیل نظرات کاربر خودداری شود. این تغییر با هدف افزایش کاربرد حرفه‌ای مدل و جلوگیری از تقویت باورهای غلط کاربر انجام شده است. در همین راستا، دمیس هاسابیس، مدیرعامل دیپ‌مایند در پستی وبلاگی تاکید کرد که پاسخ‌های جمینای ۳ هوشمند، مختصر و صریح طراحی شده‌اند تا به جای تملق و کلیشه‌، بینش واقعی ارائه دهند. به گفته مدیران ارشد گوگل، این مدل قرار است یک شریک فکری واقعی باشد و آنچه را که نیاز دارید بشنوید به شما بگوید، نه صرفاً آنچه را که دوست دارید بشنوید؛ رویکردی که ضمن کنایه آشکار به مدل‌هایی نظیر چت‌جی‌پی‌تی، بر کاهش تملق و افزایش صداقت مدل تمرکز دارد. ایمنی مدل در برابر حملات سایبری و دستکاری دستورات نیز مورد بازبینی قرار گرفته است. جمینای ۳ تحت آزمون‌های ایمنی توسط تیم‌های داخلی گوگل و نهادهای مستقل مانند Apollo و Vaultis قرار داشته است. این ارزیابی‌ها شامل تست مقاومت در برابر تولید بدافزار، ارائه دستورالعمل‌های خطرناک و نشت اطلاعات بوده است. با این حال، نسخه Deep Think به دلیل توانایی بالاتر در استدلال و احتمال بروز رفتارهای پیش‌بینی نشده، همچنان در مرحله بررسی محدود توسط متخصصان ایمنی باقی مانده و زمان دقیق عرضه عمومی آن اعلام نشده است. وضعیت عرضه و دسترسی انتشار جمینای ۳ پرو از تاریخ ۲۷ آبان آغاز شده است. این مدل از طریق سرویس‌های ابری Vertex AI، محیط گوگل AI Studio و اپلیکیشن رسمی جمینای در دسترس کاربران قرار دارد. توسعه‌دهندگان می‌توانند از طریق API به این مدل متصل شوند. محیط توسعه آنتی‌گراویتی نیز به صورت نسخه پیش‌نمایش عمومی عرضه شده است. گوگل برنامه دارد در آینده مدل‌های دیگری از خانواده جمینای ۳ را با ابعاد و توانایی‌های متفاوت عرضه کند، اما در حال حاضر فقط نسخه پرو و ابزارهای مرتبط با آن فعال هستند. مشترکین سرویس گوگل AI Ultra اولویت دسترسی به قابلیت‌های آزمایشی مانند Deep Think را خواهند داشت. انتهای پیام/∎