شناسهٔ خبر: 71265980 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: ایتنا | لینک خبر

پیشرفت چشمگیر در توسعه مدل‌های هوش مصنوعی، تنها با صرف ۵۰ دلار

در یک دستاورد مهم در حوزه هوش مصنوعی، محققان دانشگاه‌های استنفورد و واشنگتن موفق به توسعه مدل استدلالی «اس ۱» با هزینه‌ای کمتر از ۵۰ دلار شدند. این دستاورد نشان‌دهنده امکان توسعه مدل‌های هوش مصنوعی کارآمد با منابع محدود است.

صاحب‌خبر -
مدل‌های زبانی بزرگ در سال‌های اخیر پیشرفت‌های چشمگیری داشته‌اند و در وظایفی مانند پردازش زبان طبیعی، ترجمه ماشینی و تولید متن عملکرد قابل‌توجهی نشان داده‌اند، با این حال، آموزش این مدل‌ها معمولاً نیازمند منابع محاسباتی و مالی قابل‌توجهی است. مدل «اس ۱» با هدف کاهش این هزینه‌ها و ارائه روشی کارآمدتر برای آموزش مدل‌های زبانی توسعه یافته است.

محققان برای توسعه مدل «اس ۱» از رویکردی به نام «مقیاس‌گذاری در زمان آزمون» (Test-time scaling) استفاده کرده‌اند.

این روش شامل افزایش منابع محاسباتی در زمان استنتاج مدل به منظور بهبود عملکرد آن است. به طور خاص، آن‌ها مجموعه داده‌ای کوچک شامل ۱۰۰۰ سؤال همراه با مسیرهای استدلال و پاسخ‌های مربوطه را تهیه کردند.

این مجموعه داده با دقت انتخاب شده است تا تنوع و کیفیت بالایی داشته باشد.

پس از تهیه مجموعه داده، مدل پایه با استفاده از این داده‌ها و با روش «پیش‌بینی توکن بعدی» آموزش داده شد. فرآیند آموزش تنها ۲۶ دقیقه طول کشید و از ۱۶ واحد پردازش گرافیکی (GPU) مدل H100 استفاده شد.

یکی از نوآوری‌های کلیدی در این تحقیق، معرفی تکنیکی به نام «تحمیل بودجه» (Budget forcing) است. این روش به کنترل مدت زمان استدلال مدل در زمان آزمون کمک می‌کند. به عبارت دیگر، با استفاده از این تکنیک، می‌توان مدت زمانی که مدل برای تولید پاسخ صرف می‌کند را تنظیم کرد. این کار با افزودن یا حذف توکن‌های خاصی در خروجی مدل انجام می‌شود که مدل را ترغیب به ادامه یا خاتمه استدلال می‌کند.

مدل «اس ۱» در آزمون‌های مختلف عملکرد قابل‌توجهی نشان داده است. به عنوان مثال، در آزمون‌های ریاضی رقابتی مانند MATH و AIME24، این مدل تا ۲۷٪ بهتر از مدل o1 شرکت OpenAI عمل کرده است. این نتایج نشان‌دهنده کارایی بالای مدل s1 در وظایف استدلالی است.

این تحقیق نشان می‌دهد که با استفاده از روش‌های مناسب و بهینه‌سازی‌های هوشمندانه، می‌توان مدل‌های هوش مصنوعی کارآمدی را با هزینه‌های بسیار کمتر توسعه داد. این امر می‌تواند به دموکراتیزه‌کردن دسترسی به فناوری‌های هوش مصنوعی کمک کند و امکان استفاده از این فناوری‌ها را برای سازمان‌ها و افرادی که منابع محدودی دارند، فراهم سازد.

با توجه به نتایج امیدوارکننده این تحقیق، انتظار می‌رود که در آینده تحقیقات بیشتری در زمینه مقیاس‌گذاری در زمان آزمون و تکنیک‌های مشابه انجام شود. این تحقیقات می‌توانند به توسعه مدل‌های هوش مصنوعی با کارایی بالاتر و هزینه‌های کمتر منجر شوند و کاربردهای جدیدی را در حوزه‌های مختلف ممکن سازند.