شناسهٔ خبر: 70938386 - سرویس علمی-فناوری
نسخه قابل چاپ منبع: دیدبان ایران | لینک خبر

هوش مصنوعی DeepSeek چیست؟ رقیب رایگان و بدون تحریم ChatGPT

استارتاپ چینی (DeepSeek AI)درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

صاحب‌خبر -

به گزارش سایت دیده بان ایران؛  DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V۳ نام دارد، اواخر ۲۰۲۴ منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V۳ و برتری آن نسبت به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کار‌های مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگر‌های گرافیکی H۸۰۰ مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V۳ هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama ۳.۱ متعلق به متا، GPT-۴o از OpenAI و Qwen ۲.۵، ۷۲B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V۳ با مجموعه داده‌ای از ۱۴ تریلیون و ۸۰۰ میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. DeepSeek V۳ از نظر اندازه نیز بسیار وسیع است و از ۶۷۱ میلیارد پارامتر پشتیبانی می‌کند (پارامتر‌ها متغیر‌های داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً ۱.۶ برابر از Llama ۳.۱۴۰۵B شرکت متا بزرگ‌تر است که از ۴۰۵ میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در ۲ ماه و با هزینه‌ای نزدیک به ۵.۵۸ میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V۳

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزار‌های قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V۳ با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

در مثال زیر، توانایی DeepSeek V۳ در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

درکل، ‎ درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کد‌های پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند، اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V۳ تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V۳

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V۳ استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفت‌و‌گو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندرویدو iOS نیز موجود است.

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

 

کپی لینک
کانال رسمی دیدبان ایران در تلگرام