صاحبخبر -
مدلهای زبانی بزرگ در سالهای اخیر پیشرفتهای چشمگیری داشتهاند و در وظایفی مانند پردازش زبان طبیعی، ترجمه ماشینی و تولید متن عملکرد قابلتوجهی نشان دادهاند، با این حال، آموزش این مدلها معمولاً نیازمند منابع محاسباتی و مالی قابلتوجهی است. مدل «اس ۱» با هدف کاهش این هزینهها و ارائه روشی کارآمدتر برای آموزش مدلهای زبانی توسعه یافته است.
محققان برای توسعه مدل «اس ۱» از رویکردی به نام «مقیاسگذاری در زمان آزمون» (Test-time scaling) استفاده کردهاند.
این روش شامل افزایش منابع محاسباتی در زمان استنتاج مدل به منظور بهبود عملکرد آن است. به طور خاص، آنها مجموعه دادهای کوچک شامل ۱۰۰۰ سؤال همراه با مسیرهای استدلال و پاسخهای مربوطه را تهیه کردند.
این مجموعه داده با دقت انتخاب شده است تا تنوع و کیفیت بالایی داشته باشد.
پس از تهیه مجموعه داده، مدل پایه با استفاده از این دادهها و با روش «پیشبینی توکن بعدی» آموزش داده شد. فرآیند آموزش تنها ۲۶ دقیقه طول کشید و از ۱۶ واحد پردازش گرافیکی (GPU) مدل H100 استفاده شد.
یکی از نوآوریهای کلیدی در این تحقیق، معرفی تکنیکی به نام «تحمیل بودجه» (Budget forcing) است. این روش به کنترل مدت زمان استدلال مدل در زمان آزمون کمک میکند. به عبارت دیگر، با استفاده از این تکنیک، میتوان مدت زمانی که مدل برای تولید پاسخ صرف میکند را تنظیم کرد. این کار با افزودن یا حذف توکنهای خاصی در خروجی مدل انجام میشود که مدل را ترغیب به ادامه یا خاتمه استدلال میکند.
مدل «اس ۱» در آزمونهای مختلف عملکرد قابلتوجهی نشان داده است. به عنوان مثال، در آزمونهای ریاضی رقابتی مانند MATH و AIME24، این مدل تا ۲۷٪ بهتر از مدل o1 شرکت OpenAI عمل کرده است. این نتایج نشاندهنده کارایی بالای مدل s1 در وظایف استدلالی است.
این تحقیق نشان میدهد که با استفاده از روشهای مناسب و بهینهسازیهای هوشمندانه، میتوان مدلهای هوش مصنوعی کارآمدی را با هزینههای بسیار کمتر توسعه داد. این امر میتواند به دموکراتیزهکردن دسترسی به فناوریهای هوش مصنوعی کمک کند و امکان استفاده از این فناوریها را برای سازمانها و افرادی که منابع محدودی دارند، فراهم سازد.
با توجه به نتایج امیدوارکننده این تحقیق، انتظار میرود که در آینده تحقیقات بیشتری در زمینه مقیاسگذاری در زمان آزمون و تکنیکهای مشابه انجام شود. این تحقیقات میتوانند به توسعه مدلهای هوش مصنوعی با کارایی بالاتر و هزینههای کمتر منجر شوند و کاربردهای جدیدی را در حوزههای مختلف ممکن سازند.∎