شناسهٔ خبر: 70497179 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: روزنامه دنیای‌اقتصاد | لینک خبر

یکی از قوی‌ترین مدل‌های «هوش مصنوعی باز» رونمایی شد

ایسنا: شرکت «دیپ‌سیک» از مدل جدید هوش مصنوعی خود رونمایی کرده است که به نظر می‌رسد یکی از قوی‌ترین مدل‌های هوش مصنوعی باز تا به امروز باشد. مدل جدید هوش مصنوعی «دیپ‌سیک وی۳» (DeepSeek V۳) که توسط شرکت «دیپ‌سیک» ابداع شده است، به توسعه‌دهندگان امکان می‌دهد تا آن را برای بیشتر اپلیکیشن‌ها از جمله اپلیکیشن‌های تجاری دانلود و اصلاح کنند.

صاحب‌خبر -

به نقل از تک کرانچ، دیپ‌سیک وی۳ می‌تواند طیف گسترده‌ای از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با توجه به درخواست انجام دهد. براساس آزمایش‌های داخلی شرکت دیپ‌سیک، دیپ‌سیک وی۳ هم از مدل‌های قابل دانلود «باز» در دسترس و هم از مدل‌های «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل می‌کند. در زیرمجموعه‌ای از رقابت‌های کدنویسی که در پلتفرم «کدفورسز» (Codeforces) میزبانی می‌شوند، دیپ‌سیک وی۳ توانست بهتر از مدل‌های دیگر مانند  «Llama ۳.۱ ۴۰۵B» شرکت «متا»(Meta) ،«GPT-۴o» شرکت «اوپن‌ای‌آی» (OpenAI) و «Qwen ۲.۵ ۷۲B» شرکت «علی‌بابا»  (Alibaba)عمل می‌کند.

دیپ‌سیک گفت که دیپ‌سیک‌وی۳ روی یک مجموعه داده متشکل از ۱۴.۸تریلیون توکن آموزش دیده است. در علم داده، توکن‌ها برای نمایش بیت‌های داده خام استفاده می‌شوند. یک‌میلیون توکن معادل حدود ۷۵۰هزار کلمه است.

اگرچه دیپ‌سیک‌وی۳ کاربردی‌ترین مدل نیست، اما از برخی جهات یک دستاورد به‌شمار می‌رود. دیپ‌سیک توانست این مدل را با استفاده از مرکز داده پردازنده‌های گرافیکی H۸۰۰ شرکت «انویدیا» (Nvidia) در حدود ۲ماه آموزش دهد. این شرکت خاطرنشان کرد فقط ۵.۵میلیون دلار برای آموزش دیپ‌سیک‌وی۳ هزینه کرده که کسری از هزینه توسعه مدل‌هایی مانند  GPT-۴ است.

برچسب‌ها: