شرکت OpenAI مدل استدلالی جدیدی را از هوش مصنوعی خود با نام o1 عرضه کرده که برای پاسخ به پرسشهایپیچیدهتر با سرعتی بیشتر از انسان آموزش دیدهاند.
این مدل همراه با نسخه کوچکتر و ارزانتر o1-mini در دسترس کاربران قرار گرفته است.
برای OpenAI مدل o1 گامی به سوی هدف بزرگتر این شرکت یعنی دستیابی به هوش مصنوعی شبیه به انسان است.
از نظر عملی این مدل عملکرد بهتری در نوشتن کد و حل مسایل چند مرحلهای نسبت به مدلهای قبلی دارد اما نسبت به GPT-4o گرانتر و کندتر است.
نخستین نسخه این مدل با عنوان Preview یا پیشنمایش عرضه شد تا احتمالا تاکیدی بر این باشد که این مدل هنوز در مراحل ابتدایی است.
کاربران سرویس پلاس چتجیپیتی به نسخه o1-Preview و o1-mini از امروز دسترسی دارند در حالی که کاربران سرویسهای اینترپرایز و EDU اوایل هفته آینده به این مدلها دسترسی خواهند داشت.
شرکت OpenAI اعلام کرده که قصد دارد دسترسی به o1-mini را برای همه کاربران رایگان چتجیپیتی عرضه کند اما هنوز تاریخ دقیقی برای این موضوع اعلام نشده است.
دسترسی توسعهدهندگان از طریق API به این مدل بسیار گران است: به طور مثال دسترسی به o1 از این طریق برابر با ۱۵ دلار به ازای هر یک میلیون توکن ورودی ۶۰ دلار برای هر ۱ میلیون توکن خروجی است. در مقایسه با GPT-4o که ۵ دلار برای ۱ میلیون توکن ورودی و ۱۵ دلار برای هر ۱ میلیون توکن خروجی است.
جری تورک سرپرست تحقیقاتی شرکت OpenAI: آموزش دادن مدل o1به طور اساسی با مدلهای قبلی متفاوت است. این مدل با استفاده از یک الگوریتم بهینهسازی شده کاملا جدید و یک مجموعه داده جدید که به طور خاص برای آن طراحی شده، آموزش داده شده است.
این مدل از «زنجیره تفکر» برای پردازش پرسشها استفاده میکند مشابه با روشی که انسانها مسایل را مرحله به مرحله تحلیل میکنند.
بر اساس این روش آموزشی جدید شرکت OpenAI معتقد است که این مدل بسیار دقیق است د و کمتر دچار توهم میشود هرچند به گفته مدیران این شرکت مسئله توهمات در این مدل کاملا حل نشده است.
تفاوت مدل o1 با مدلهای قبلی
تفاوت اصلی این مدل با GPT-4o در حل مسایل پیچیده مانند کدنویسی و ریاضیات است در حالی که میتواند توضیحاتی را نیز در مورد استدلال خود ارایه دهد.
باب مکگرو مدیر تحقیقات OpenAI میگوید: این مدل قطعا در حل تست ریاضی APبهتر از من عمل میکند من خودم در دوران دانشگاه رشته فرعی ریاضیات را خواندهام.
این شرکت این مدل را با آزمون مقدماتی المپیاد ریاضی هم آزمایش کرده و در حالی که GPT-4oتنها ۱۳ درصد مسایل را به درستی حل کرده در مدل o1 میزان حل مسایل به ۸۳ درصد رسیده است.
این مدل همچنین در مسابقات برنامه نویسی آنلاین مانند رقابتهای کدفورس به سطح ۸۹ درصد شرکت کنندگان رسید.
OpenAI معتقد است که در به روزرسانیهای بعدی این مدل عملکردی مشابه با دانشجویان دکترا در انجام وظایف چالشی در زمینه فیزیک، شیمی و زیستشناسی خواهد داشت.
با این حال o1در بسیاری از حوزهها به اندازه GPT-4o توانمند نیست. این مدل در زمینه دانش واقعی در جهان عملکرد خوبی ندارد و توانایی مرور وب یا پردازش فایل و تصویر را هم ندارد.
با این وجود OpenAI معتقد است که o1 نماینده یک کلاس جدید از قابلیتهاست و نامگذاری آن هم مفهوم شماره از ۱ را دارد که به تدریج پیشرفتهتر خواهد شد.
مدلی شبیهتر به انسان
باب مکگرو معتقد است که این مدل در مواردی به طرز شگفتآوری شبیه به انسان عمل میکنتد. این مدل برای پردازش پرسشها زمان محدودی دارد و ممکن است بگوید « اوه وقتم داره تمام میشه اجازه بدید سریعتر به پاسخ برسم» یا در مراحل اولیه تفکر زنجیرهایاش که در حال ایدهپردازی است ممکن است بگوید: میتوانم این کار را انجام دهم یا آن کار را؟ حالا باید چه کار کنم؟
مدلهای زبان بزرگ (LLMها) به شکلی که امروزه وجود دارند، لزوماً هوشمند نیستند. آنها اساساً توالیهای کلمات را پیشبینی میکنند تا بر اساس الگوهای یادگرفته شده از دادههای بسیار زیاد، پاسخی ارائه دهند. به عنوان مثال، ChatGPT گاهی به اشتباه ادعا میکند که کلمه «strawberry» تنها دو حرف “R” دارد، چون کلمه را بهدرستی تجزیه نمیکند. در حالی که مدل جدید o1 در این مورد پاسخ درستی داد.
OpenAI در حالی که به دنبال جمعآوری سرمایه بیشتر با ارزشی معادل ۱۵۰ میلیارد دلار است، به دستاوردهای پژوهشی جدید نیاز دارد تا این حرکت رو به رشد خود را ادامه دهد. این شرکت در حال افزودن قابلیتهای استدلالی به مدلهای زبان بزرگ است، زیرا آیندهای را میبیند که در آن سیستمهای خودمختار یا عاملها قادر به تصمیمگیری و انجام اقدامات بهجای کاربران خواهند بود.
برای پژوهشگران هوش مصنوعی، گشودن رمز و راز استدلال، گامی حیاتی در جهت دستیابی به هوش سطح انسانی محسوب میشود. این باور وجود دارد که اگر یک مدل بتواند فراتر از تشخیص الگوها عمل کند، ممکن است در حوزههایی مانند پزشکی و مهندسی نوآوریهای بزرگی ایجاد شود. اما در حال حاضر، قابلیتهای استدلالی مدل o1 نسبتاً کند، غیرعاملگونه و برای توسعهدهندگان گران است.
مکگرو میگوید: «ما ماهها روی مسئله استدلال کار کردهایم، زیرا معتقدیم که این در واقع همان دستاورد بحرانی است. این اساساً یک نوع جدید از مدلها است که قادر خواهد بود مسائل بسیار دشوار را حل کند و این گامی در جهت پیشرفت به سوی سطوح هوش شبیه به انسان است.»
زنجیره تفکر چیست؟
زنجیره تفکر (Chain of Thought) یک تکنیک در مدلهای هوش مصنوعی است که به مدلها اجازه میدهد تا مسائل پیچیده را به مراحل کوچکتر و قابل مدیریت تقسیم کنند و هر مرحله را به صورت متوالی حل کنند. این روش به مدلها کمک میکند تا به جای تولید پاسخهای سریع و ساده، مانند انسانها به طور مرحله به مرحله درباره مسائل فکر کنند و راهحلهای عمیقتر و دقیقتری ارائه دهند.
در این روش، مدل ابتدا ورودی یا پرسش را دریافت میکند، سپس بهجای این که به سرعت یک پاسخ نهایی ارائه دهد، فرایند حل مسئله را گام به گام شرح میدهد. این گامها میتوانند شامل تحلیل مشکل، ایجاد فرضیات، بررسی راهحلهای ممکن، و در نهایت نتیجهگیری باشند. بهعنوان مثال، اگر مسئلهای ریاضی ارائه شود، مدل ابتدا مسئله را تقسیمبندی میکند، فرمولها و روابط مربوطه را بررسی میکند و سپس مرحله به مرحله به پاسخ میرسد.
این تکنیک کمک میکند تا مدلهای هوش مصنوعی، مانند مدلهای OpenAI، در حل مسائل پیچیدهتر، مانند کدنویسی، ریاضیات یا استدلالهای چند مرحلهای، عملکرد بهتری داشته باشند.
∎