به گزارش گروه دانشگاه خبرگزاری دانشجو، مدل جدید هوش مصنوعی موسوم به «s۱» در آزمایشهای ریاضی و کدنویسی توانست مشابه مدلهای استدلالی پیشرفته مانند «o۱» شرکت «اوپنایآی» (OpenAI) و «R۱» شرکت «دیپسیک» (DeepSeek) عمل میکند. مدل s۱ به همراه دادهها و کد مورد استفاده برای آموزش آن در پلتفرم «گیتهاب» (GitHub) موجود است.
به نقل از تک کرانچ، تیم پشتیبانی s۱ گفتند که کار خود را با یک مدل پایه شروع کردند و سپس طی فرآیندی برای استخراج قابلیتهای استدلالی از یک مدل هوش مصنوعی دیگر به تنظیم آن پرداختند. پژوهشگران گفتند s۱ از یکی از مدلهای استدلالی «گوگل» موسوم به «Gemini ۲.۰ Flash Thinking Experimental» استخراج شده است. آنها همان رویکردی را در پیش گرفتند که پژوهشگران «دانشگاه کالیفرنیا برکلی» در ماه گذشته برای ایجاد یک مدل هوش مصنوعی استدلالی با قیمت حدود ۴۵۰ دلار استفاده کردند.
برای برخی، این ایده که چند پژوهشگر بدون میلیونها دلار بودجه بتوانند در فضای هوش مصنوعی نوآوری کنند، هیجانانگیز است، اما s۱ نگرانیهایی را درباره کالایی شدن مدلهای هوش مصنوعی ایجاد میکند؛ از جمله این که اگر یک نفر با مبلغ کم بتواند یک مدل چند میلیون دلاری را بازسازی کند، چه اتفاقی میافتد.
جای تعجب نیست که شرکتهای بزرگ هوش مصنوعی خوشحال نیستند. اوپنایآی اخیرا شرکت دیپسیک را به برداشت نامناسب دادهها از API خود متهم کرده است.
پژوهشگران سازنده s۱ به دنبال یافتن سادهترین رویکرد برای دستیابی به عملکرد استدلال قوی و مقیاسبندی زمان آزمایش بودند تا به یک مدل هوش مصنوعی امکان دهند که پیش از پاسخ دادن به یک پرسش، بیشتر فکر کند.
مقاله نوشتهشده درباره s۱ نشان میدهد که مدلهای استدلالی را میتوان با یک مجموعه داده نسبتا کوچک با استفاده از فرآیندی به نام «تنظیم دقیق نظارتشده» آموزش داد که در آن به یک مدل هوش مصنوعی به صراحت دستور داده میشود که رفتارهای خاصی را در یک مجموعه داده تقلید کند.