مطالعهای بزرگ نشان میدهد مدلهای زبانی میتوانند از انسان متوسط خلاقتر باشند.
به گزارش sciencedaily، آیا سامانههای هوش مصنوعی مولد مانند ChatGPT واقعا قادر به خلاقیت هستند؟ یک پژوهش گسترده و کمسابقه به رهبری کریم جربی، استاد روانشناسی دانشگاه مونترال کانادا پاسخی علمی به این پرسش داده است. در این مطالعه که یوشوا بنجیو از پیشگامان برجسته هوش مصنوعی نیز مشارکت داشته، خلاقیت انسان و مدلهای زبانی بزرگ بهطور مستقیم با یکدیگر مقایسه شدهاند.
نتایج این پژوهش که در نشریه علمی Scientific Reports منتشر شده نشان میدهد برخی سامانههای هوش مصنوعی اکنون در برخی شاخصهای خلاقیت عملکردی بالاتر از انسان متوسط دارند؛ هرچند همچنان خلاقترین انسانها فراتر از توان بهترین مدلهای هوش مصنوعی عمل میکنند.
عبور هوش مصنوعی از میانگین خلاقیت انسانی
پژوهشگران در این مطالعه عملکرد چندین مدل زبانی بزرگ از جمله ChatGPT، Claude و Gemini را با دادههای حاصل از بیش از ۱۰۰ هزار شرکتکننده انسانی مقایسه کردند. یافتهها از یک نقطه عطف مهم حکایت دارد: برخی مدلهای هوش مصنوعی از جمله GPT-۴ در آزمونهای خلاقیت زبانی واگرا امتیازی بالاتر از میانگین انسانها کسب کردهاند.
کریم جربی در اینباره میگوید: نتایج نشان میدهد برخی سامانههای مبتنی بر مدلهای زبانی بزرگ میتوانند در وظایف مشخص از خلاقیت انسان متوسط پیشی بگیرند. این موضوع شاید شگفتانگیز یا حتی نگرانکننده باشد، اما در عین حال یک واقعیت مهم دیگر را هم روشن میکند؛ اینکه بهترین هوشهای مصنوعی هنوز به سطح خلاقترین انسانها نمیرسند.
خلاقترین انسانها هنوز دستنیافتنیاند
تحلیلهای تکمیلی پژوهش نشان میدهد نیمی از خلاقترین شرکتکنندگان انسانی بهطور میانگین امتیازهایی بالاتر از تمام مدلهای هوش مصنوعی آزمایششده به دست آوردهاند. این فاصله در میان ۱۰ درصد برتر افراد خلاق حتی پررنگتر بوده است.
به گفته پژوهشگران اگرچه هوش مصنوعی توانسته از سطح خلاقیت متوسط عبور کند، اما بالاترین سطوح خلاقیت همچنان ویژگی منحصربهفرد ذهن انسان باقی مانده است.
خلاقیت چگونه سنجیده شد؟
برای مقایسه منصفانه انسان و ماشین تیم تحقیقاتی از ابزارهای روانشناختی یکسان استفاده کرد. مهمترین ابزار آزمون وظیفه تداعی واگرا (Divergent Association Task – DAT) بود؛ آزمونی که توانایی تولید ایدههای متنوع و غیرمنتظره را میسنجد.
در این آزمون، از شرکتکننده (چه انسان و چه هوش مصنوعی) خواسته میشود ۱۰ واژه با بیشترین تفاوت معنایی ارائه کند. ترکیبهایی مانند کهکشان، چنگال، آزادی، جلبک، هارمونیکا، کوانتوم، نوستالژی، مخمل، طوفان، فتوسنتز نمونهای از پاسخهای خلاقانه محسوب میشوند.
پژوهشگران تاکید میکنند این آزمون صرفا سنجش دایره لغات نیست بلکه فرآیندهای شناختی عمیقتری را که در تفکر خلاق نقش دارند فعال میکند.
از آزمون واژه تا نوشتن خلاقانه
در مرحله بعد پژوهشگران بررسی کردند آیا عملکرد بالای هوش مصنوعی در آزمونهای ساده واژگانی به فعالیتهای پیچیدهتر خلاقانه نیز تعمیم مییابد یا خیر. برای این منظور انسانها و هوش مصنوعی در نوشتن هایکو خلاصه داستان فیلم و داستان کوتاه با یکدیگر مقایسه شدند.
نتایج بار دیگر الگوی مشابهی را نشان داد: هوش مصنوعی گاهی از انسان متوسط پیشی میگیرد، اما خلاقترین نویسندگان انسانی همچنان برتری محسوسی دارند.
آیا میتوان خلاقیت هوش مصنوعی را تنظیم کرد؟
یکی از پرسشهای کلیدی این پژوهش آن بود که آیا خلاقیت هوش مصنوعی قابل کنترل است؟ پاسخ پژوهشگران مثبت است. به گفته آنها تنظیم دما در مدلهای زبانی (پارامتری که میزان جسارت و تنوع پاسخها را تعیین میکند) نقش مهمی در سطح خلاقیت خروجی دارد.
همچنین نوع دستور یا پرامپت تاثیر قابلتوجهی دارد. برای مثال درخواستهایی که مدل را به توجه به ریشهشناسی واژهها سوق میدهد به تولید ایدههای غیرمنتظرهتر و امتیاز خلاقیت بالاتر منجر میشود.
هوش مصنوعی جایگزین خلاقان میشود؟
برخلاف برخی نگرانیها پژوهشگران معتقدند این نتایج به معنای حذف خلاقیت انسانی نیست. کریم جربی تاکید میکند: ما باید از رقابت سادهانگارانه میان انسان و ماشین عبور کنیم. هوش مصنوعی بیش از هر چیز، به ابزاری قدرتمند در خدمت خلاقیت انسانی تبدیل شده است؛ ابزاری که شیوه تخیل، اکتشاف و خلق را دگرگون میکند.
به باور پژوهشگران آینده خلاقیت نه در تقابل انسان و ماشین بلکه در همکاری میان آنها شکل خواهد گرفت؛ جایی که هوش مصنوعی نقش دستیار خلاق را ایفا میکند و دامنه امکانها را گسترش میدهد.
مقاله خلاقیت واگرا در انسانها و مدلهای زبانی بزرگ در تاریخ ۲۱ ژانویه ۲۰۲۶ در نشریه Scientific Reports منتشر شده است.
انتهای پیام/