أخبار تقنية

DeepSeek-V3 ثورة جديدة في عالم الذكاء الاصطناعي المفتوح المصدر

Published

on

أعلنت شركة DeepSeek AI الصينية، الرائدة في مجال الذكاء الاصطناعي، عن إطلاق نموذجها الجديد DeepSeek-V3، الذي يُعتبر أحد أقوى النماذج المفتوحة المصدر عالميًا.

DeepSeek-V3 ثورة جديدة في عالم الذكاء الاصطناعي المفتوح المصدر

يعتمد النموذج على تقنية مبتكرة تُسمى “Mixture-of-Experts” أو اختصارًا (MoE)، حيث يحتوي على 671 مليار معلَمة، مع تفعيل 37 مليار معلَمة لكل إدخال نصي. تُعدّ هذه المَعلَمات مؤشرًا رئيسيًا لقياس كفاءة وقوة النماذج.

DeepSeek-V3 ثورة جديدة في عالم الذكاء الاصطناعي المفتوح المصدر

تفوق في الأداء على النماذج المغلقة

وفقًا لاختبارات الأداء القياسية، أظهر DeepSeek-V3 تفوقًا ملحوظًا على نماذج مغلقة المصدر شهيرة مثل GPT-4 من OpenAI وClaude 3.5 من Anthropic. كما حقق هذا النموذج نتائج مميزة في تسعة معايير أداء رئيسية، متخطّيًا كافة النماذج الأخرى ضمن الفئة نفسها.

تكلفة تدريب أقل وفعالية تشغيلية عالية

استغرق تدريب DeepSeek-V3 حوالي 2.788 مليون ساعة باستخدام وحدات معالجة الرسوميات H800، بتكلفة بلغت 5.6 ملايين دولار. ويعزى انخفاض التكلفة مقارنةً بنماذج أخرى مثل Llama 3 من Meta (الذي يحتاج إلى 30.8 مليون ساعة تدريب) إلى التحسينات الهندسية المتقدمة التي طُبقت في النموذج.

كفاءة تشغيلية استثنائية

يمتاز النموذج بكفاءة تشغيلية تجعل تكلفة الإدخال أقل بعشر مرات مقارنة بالنماذج الرائدة الأخرى مثل تلك التي تقدمها OpenAI، مما يجعله خيارًا اقتصاديًا للشركات والمطورين.

تعزيز الوصول إلى تقنيات الذكاء الاصطناعي

أعرب فريق DeepSeek، عبر بيان نشره على منصة إكس، عن تفاؤله الكبير بما حققه النموذج الجديد، مشيرًا إلى أنه يمثل خطوة نوعية لتقليص الفجوة بين النماذج المفتوحة والمغلقة.

إتاحة النموذج للجميع

يمكن تنزيل نموذج DeepSeek-V3 من منصتي GitHub وHuggingFace، مما يسهم في توفير تقنيات الذكاء الاصطناعي المتقدمة بأسعار معقولة وعلى نطاق عالمي. يُعتبر هذا الإصدار نقلة هامة في مسار إتاحة الذكاء الاصطناعي للجميع، بدلًا من اقتصاره على شركات أو دول معينة.

Trending

Exit mobile version