مدلهای هوش مصنوعی با سرعت بسیار بالایی توسط شرکتهای بزرگ فناوری مانند گوگل و استارتاپهایی مانند OpenAI و Anthropic تولید میشوند.
به گزارش ایتنا و به نقل از TechCrunch، با این حجم از مدلهای جدید، پیگیری آخرین پیشرفتها میتواند دشوار باشد. مشکل زمانی پیچیدهتر میشود که مدلهای هوش مصنوعی معمولاً بر اساس شاخصهای صنعتی تبلیغ میشوند، اما این معیارهای فنی اغلب اطلاعات کمی درباره نحوه استفاده واقعی افراد و شرکتها از آنها ارائه میدهند.
این راهنما جزئیاتی در مورد نحوه عملکرد هر مدل و کاربردهای آن ارائه میدهد.
با بیش از یک میلیون مدل هوش مصنوعی در حال حاضر، بهطور مثال HuggingFace بیش از 1.4 میلیون مدل را میزبانی میکند، مدلهای موجود در این فهرست تنها نمونهای از بهترینها هستند. لازم به ذکر است که برخی مدلها ممکن است در زمینههای خاص عملکرد بهتری داشته باشند، اما اکنون به بررسی برخی از مدلهای برجسته میپردازیم.
مدلهای هوش مصنوعی منتشر شده در ۲۰۲۵

OpenAI o3-mini
مدل جدید OpenAI به نام o3-mini برای انجام وظایف مرتبط با STEM مانند کدنویسی، ریاضیات و علوم بهینهسازی شده است. این مدل قدرتمندترین مدل OpenAI نیست، اما به دلیل اندازه کوچکتر، هزینه کمتری دارد. این مدل رایگان است، اما کاربران حرفهای برای استفاده بیشتر نیاز به اشتراک دارند.

OpenAI Deep Research
Deep Research OpenAI برای انجام تحقیقات عمیق در یک موضوع و ارائه ارجاعات دقیق طراحی شده است. این سرویس فقط برای کاربران اشتراکی با طرح Pro ماهانه 200 دلار در دسترس است. OpenAI این مدل را برای تحقیقات در زمینههای مختلف از جمله علوم و تحقیقات خرید توصیه میکند، اما باید مراقب پدیده هالوکیشن (اشتباهات تصوری) در هوش مصنوعی باشید.

Mistral Le Chat
Mistral نسخههای اپلیکیشن Le Chat، دستیار هوش مصنوعی چندوجهی خود را راهاندازی کرده است. Mistral ادعا میکند که Le Chat سریعتر از هر چتبات دیگری پاسخ میدهد. نسخه پرداختی آن شامل اخبار بهروز از AFP است. اما آزمایشات Le Monde نشان داد که عملکرد آن نسبت به ChatGPT اشتباهات بیشتری داشت.

OpenAI Operator
OpenAI Operator به عنوان یک دستیار شخصی طراحی شده که میتواند وظایفی را بهطور مستقل انجام دهد، مانند کمک به خرید مواد غذایی. این مدل به اشتراک Pro ماهانه 200 دلار نیاز دارد و هنوز در مرحله آزمایشی است. یک بررسی از واشنگتن پست گزارش داد که Operator تصمیم گرفت بهطور خودکار دوازده تخممرغ به قیمت 31 دلار سفارش دهد و هزینه آن را از کارت اعتباری نویسنده پرداخت کرد.

Google Gemini 2.0 Pro Experimental
مدل پرانتظار Google Gemini 2.0 در زمینه کدنویسی و درک اطلاعات عمومی عملکرد خوبی دارد. این مدل همچنین دارای یک پنجره متنی طولانی 2 میلیون توکن است که به کاربران کمک میکند تا مقادیر زیادی از متن را بهسرعت پردازش کنند. برای استفاده از این مدل به حداقل یک اشتراک Google One AI Premium به قیمت 19.99 دلار در ماه نیاز است.
مدلهای هوش مصنوعی منتشر شده در ۲۰۲۴

DeepSeek R1
مدل DeepSeek R1 از چین در سیلیکون ولی توجه زیادی را به خود جلب کرد. این مدل در کدنویسی و ریاضیات عملکرد خوبی دارد و از آنجا که متنباز است، کاربران میتوانند آن را بهطور محلی اجرا کنند. این مدل رایگان است، اما با توجه به ادغام سانسور دولتی چین، نگرانیهایی درباره حریم خصوصی و دادهها وجود دارد.

Gemini Deep Research
ابزار Deep Research از Gemini نتایج جستجوی گوگل را در قالب یک سند ساده و با ارجاعات دقیق جمعآوری میکند. این سرویس برای دانشآموزان و هر کسی که نیاز به خلاصه تحقیق سریع دارد مفید است، اما کیفیت آن به اندازه مقالات مرور همتایان بررسی نشده است. دسترسی به این مدل نیازمند اشتراک 19.99 دلاری ماهانه Google One AI Premium است.

Meta Llama 3.3 7B
مدل Llama 3.3 جدیدترین و پیشرفتهترین نسخه مدلهای متنباز Llama از Meta است. Meta این نسخه را بهعنوان ارزانترین و کارآمدترین نسخه خود معرفی کرده است، بهویژه برای ریاضیات، اطلاعات عمومی و دنبال کردن دستورالعملها. این مدل رایگان و متنباز است.

OpenAI Sora
OpenAI Sora یک مدل است که ویدیوهای واقعی را بر اساس متن تولید میکند. هرچند این مدل میتواند صحنههای کامل تولید کند، OpenAI اذعان دارد که گاهی اوقات فیزیک غیرواقعی تولید میکند. این مدل تنها برای کاربران نسخههای پولی ChatGPT در دسترس است، شروع از طرح Plus با 20 دلار در ماه.

این مدل یکی از معدود مدلهایی است که در برخی معیارهای صنعتی با o1 از OpenAI رقابت میکند و در کدنویسی و ریاضیات برتری دارد. بهطور جالبی برای یک مدل "استدلالی"، Alibaba میگوید این مدل نیاز به "بهبود در استدلالهای مبتنی بر عقل سلیم" دارد. همچنین این مدل شامل سانسور دولتی چین است و آزمایشهای TechCrunch نشان داده که دادههای کاربران ممکن است به چین ارسال شود. این مدل رایگان و متنباز است.

Anthropic’s Computer Use
Claude's Computer Use ابزاری است که برای انجام وظایفی مانند کدنویسی یا رزرو بلیط هواپیما طراحی شده است، مشابه به OpenAI Operator. این مدل هنوز در مرحله بتا است و قیمتگذاری آن از طریق API به ازای هر میلیون توکن ورودی 0.80 دلار و هر میلیون توکن خروجی 4 دلار است.

x.AI’s Grok 2
Grok 2 از x.AI، شرکت متعلق به ایلان ماسک، نسخه پیشرفتهای از چتبات Grok است که ادعا میکند "سه برابر سریعتر" است. کاربران رایگان محدود به 10 سوال در هر دو ساعت هستند، در حالی که مشترکین طرحهای Premium و Premium+ X از محدودیتهای بالاتر استفاده میکنند. x.AI همچنین یک تولیدکننده تصویر به نام Aurora راهاندازی کرده است که تصاویر بسیار واقعگرایانهای تولید میکند.

OpenAI o1
مدل o1 از OpenAI برای تولید پاسخهای بهتر از طریق ویژگی استدلال پنهان طراحی شده است. این مدل در کدنویسی، ریاضیات و ایمنی عملکرد خوبی دارد، اما انتقادهایی نیز به فریب دادن کاربران وارد شده است. این مدل برای استفاده نیاز به اشتراک ChatGPT Plus با 20 دلار در ماه دارد.

Anthropic’s Claude Sonnet 3.5
Claude Sonnet 3.5 بهعنوان یکی از بهترین مدلها در زمینه کدنویسی شناخته شده است و بهویژه در میان تکنولوژیستها محبوب است. این مدل بهطور رایگان در Claude در دسترس است، اما کاربران سنگین باید اشتراک Pro ماهانه 20 دلار داشته باشند. این مدل میتواند تصاویر را درک کند اما قادر به تولید آنها نیست.

OpenAI GPT 4o-mini
مدل GPT 4o-mini از OpenAI کوچکترین و سریعترین مدل این شرکت است و برای انجام وظایف ساده و پرحجم مانند چتباتهای خدمات مشتری مناسب است. این مدل برای کاربران سطح رایگان ChatGPT در دسترس است و برای کارهای پیچیدهتر کمتر مناسب است.

Cohere Command R+
مدل Command R+ از Cohere در برنامههای پیچیده Retrieval-Augmented Generation (RAG) برای شرکتها عملکرد عالی دارد، بهویژه در جستجو و ارجاع قطعات خاصی از اطلاعات. اگرچه RAG برخی مشکلات هالوکیشن در هوش مصنوعی را حل میکند، اما هنوز کامل نیست.

Grok 3
ایلان ماسک در جریان رونمایی تصویری از Grok 3 در شبکه اجتماعی ایکس اعلام کرد که این مدل نسبت به Grok 2 از نظر تواناییها بهبود قابلتوجهی یافته است. Grok 3 در مقایسههای مختلف، از جمله AIME (ارزیابی عملکرد هوش مصنوعی در مسائل ریاضی) و GPQA (ارزیابی مدلها با سؤالات فیزیک، زیستشناسی و شیمی در سطح دکترا)، عملکرد بهتری نسبت به GPT-4o نشان داده است.∎