شناسهٔ خبر: 66668295 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: ایتنا | لینک خبر

جادویی‌ترین هوش مصنوعی جهان رونمایی شد؛

مزایا و قابلیت‌های «GPT-4o»

ایتنا - شرکت اوپن‌ای‌آی(OpenAI) روز گذشته از نسل جدید مدل هوش مصنوعی خود به نام GPT-4o رونمایی کرد که می‌تواند مانند یک انسان صحبت کند، بخندد، آواز بخواند و ببیند.

صاحب‌خبر -
شرکت اوپن‌ای‌آی روز گذشته مدل هوش مصنوعی GPT-4o را معرفی کرد که یک مدل کاملاً جدید از هوش مصنوعی این شرکت است که به گفته اوپن‌ای‌آی یک گام به تعامل بسیار طبیعی‌تر میان انسان و رایانه نزدیک‌تر شده است.

مدل هوش مصنوعی GPT-4o برپایه مدل پرچمدار قبلی OpenAI ساخته شده اما از جهات مختلفی بهبود پیدا کرده است و می‌تواند برقراری ارتباط با این فناوری را ساده‌تر و پویاتر کند.

شرکت اوپن‌ای‌آی(OpenAI) ادعا می‌کند که مدل رایگان GPT-4o آن می‌تواند مانند یک انسان صحبت کند، بخندد، آواز بخواند و ببیند.

این مدل جدید، هر ترکیبی از متن، صدا و تصویر را به عنوان ورودی می‌پذیرد و می‌تواند خروجی را در هر سه فرمت تولید کند. همچنین می‌تواند احساسات را تشخیص دهد، به کاربر امکان می‌دهد آن را در اواسط گفتار قطع کند و تقریباً به سرعت یک انسان در طول مکالمه پاسخ می‌دهد.

مدل هوش مصنوعی GPT-4o در اختیار تمام کاربران شامل کاربران سرویس رایگان و پولی این شرکت قرار می‌گیرد. البته عرضه همگانی این مدل قرار است طی هفته‌های آینده برای تمام کاربران انجام شود.

 GPT-4o نسخه اصلاح‌شده مدل زبانی GPT-4 است که به‌عنوان قلب تپنده چت‌بات معروف ChatGPT عمل می‌کند. حرف o در عبارت GPT-4o مخفف Omni به معنی عالم‌گیر یا جهانی است.

 


میرا موراتی مدیر ارشد فناوری شرکت اوپن‌ای‌آی در پخش زنده معرفی این مدل جدید گفت: بیش از ۱۰۰ میلیون نفر به‌صورت مرتب از ChatGPT استفاده می‌کنند و مدل GPT-4o بهینه‌تر از GPT-4 شده است. در نتیجه، این شرکت GPT‌ها یا همان چت‌بات‌های سفارشی را هم به نسخه رایگان ChatGPT می‌آورد.

API مدل هوش مصنوعی GPT-4o دو برابر سریع‌تر و ۵۰ درصد ارزان‌تر شده و محدودیت آن ۵ برابر نسبت به GPT-4 توربو کاهش پیدا کرده است.

اوپن‌ای‌آی در طول معرفی این مدل، GPT-4o را نشان داد که به صورت زنده بین انگلیسی و ایتالیایی ترجمه می‌کند، با توانایی درک بصری به یک پژوهشگر کمک می‌کند یک معادله خطی را در لحظه بر روی کاغذ حل کند و تنها با گوش دادن به نفس‌های یکی از مدیران اوپن‌ای‌آی درباره تنفس عمیق به او راهنمایی می‌دهد.

اوپن‌ای‌آی گفت که GPT-4o با متن، تصویر و صدا آموزش داده شده است، به این معنی که تمام ورودی‌ها و خروجی‌ها توسط یک شبکه عصبی پردازش می‌شوند. این با مدل‌های قبلی این شرکت شامل GPT-3.5 و GPT-4 متفاوت است که به کاربران اجازه می‌دادند تنها با صحبت کردن سؤال بپرسند، اما سپس سخنان را به متن تبدیل می‌کردند. این موجب می‌شد لحن و احساسات از بین برود و تعاملات کندتر شود.

شرکت اوپن‌ای‌آی این مدل جدید را طی چند هفته آینده آینده به صورت رایگان در دسترس همگان از جمله کاربران ChatGPT قرار می‌دهد و همچنین نسخه دسکتاپ ChatGPT را در ابتدا برای رایانه‌های شرکت اپل(Mac) منتشر می‌کند که کاربرانی که اشتراک خریداری کرده‌اند، از امروز به آن دسترسی خواهند داشت.

نظر شما