DeepSeek-V3.. نموذج ذكاء اصطناعي صيني يُحدث ثورة في النماذج المفتوحة المصدر

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
DeepSeek-V3.. نموذج ذكاء اصطناعي صيني يُحدث ثورة في النماذج المفتوحة المصدر, اليوم السبت 28 ديسمبر 2024 11:24 صباحاً

أعلنت شركة DeepSeek AI الصينية المتخصصة في مجال الذكاء الاصطناعي إطلاق نموذجها الجديد DeepSeek-V3، الذي يُعدّ من أقوى النماذج المفتوحة المصدر في العالم.

ويعتمد النموذج على تقنية جديدة تُطلق عليها الشركة اسم “Mixture-of-Experts أو اختصارًا (MoE)”، ويضم النموذج 671 مليار معلَمة مع تفعيل 37 مليار معلَمة لكل إدخال نصي، وتُعد المَعلَمات (Parameters) وسيلة لقياس كفاءة النماذج وقوتها.

ووفقًا لاختبارات الأداء القياسية للذكاء الاصطناعي، فقد أثبت DeepSeek-V3 تفوقه على نماذج شهيرة مغلقة المصدر مثل GPT-4o من OpenAI وClaude 3.5 من شركة أنثروبيك، كما حقق هذا النموذج نتائج رائدة في تسعة معايير أداء رئيسية، متفوقًا على كافة النماذج الأخرى من الفئة نفسها.

ويحتاج DeepSeek-V3 إلى 2.788 مليون ساعة تدريب باستخدام وحدات معالجة الرسوميات H800، بتكلفة تُقدَّر بنحو 5.6 ملايين دولار. وللمقارنة، فإن نموذج Llama 3 من ميتا (بـ 405 مليارات مَعلَمة) يحتاج إلى 30.8 مليون ساعة تدريب، ويُعزى انخفاض التكلفة إلى دعم تقنية متطورة في النموذج، وإجراء تحسينات هندسية عميقة.

وفيما يخص التشغيل، يقدم DeepSeek-V3 كفاءة استثنائية؛ إذ إن تكلفة الإدخال في هذا النموذج أقل بعشر مرات من تكلفة النماذج الرائدة الأخرى، مثل تلك التي تقدمها OpenAI.

وفي بيانٍ عبر منصة إكس، أعرب فريق DeepSeek عن تفاؤله بالإنجاز الجديد، مشيرًا إلى أن هذا النموذج يشكّل خطوة نحو تقليص الفجوة بين النماذج المفتوحة والمغلقة.

ويتوفر نموذج DeepSeek-V3 للتنزيل عبر منصتي GitHub و HuggingFace، مما يفتح آفاقًا جديدة للوصول إلى النماذج المتقدمة بأسعار معقولة. ويُعدّ هذا الإصدار خطوة هامة نحو إتاحة الوصول إلى تقنيات الذكاء الاصطناعي المتقدمة على نطاق عالمي دون أن تكون متاحة حصريًا لشركات أو دول بعينها.

نسخ الرابط تم نسخ الرابط