أعلنت شركة DeepSeek الصينية عن إطلاق نماذج ذكاء اصطناعي جديدة تحمل اسم R1 وR1-Zero، مدّعية أنها تضاهي أداء نماذج OpenAI-o1 الشهيرة، التي تعتمد على التفكير المنطقي والتقييم قبل تقديم الإجابات. هذه الخطوة تُعدّ تحولًا كبيرًا في المنافسة بين شركات الذكاء الاصطناعي العالمية، حيث تسعى DeepSeek إلى تقديم تقنيات متطورة بأسعار تنافسية.
رغم إمكانياته الواعدة، واجه نموذج R1-Zero مشكلتين رئيسيتين:
صعوبة قراءة الإجابات.
خلط اللغات في بعض الحالات.
وللتغلب على هذه التحديات، أطلقت الشركة نموذج R1، الذي بدأ بتدريب مبدئي على بيانات صغيرة وخضع لجولات متعددة من التعلم المعزز لتحسين الأداء.
اختبارات الأداء والمعايير الاستدلالية
أظهرت الاختبارات أن نموذج R1 حقق نتائج مقاربة جدًا لنموذج OpenAI-o1-1217 في العديد من المعايير الاستدلالية.
تفوقت النماذج الصغيرة المُقطّرة (Distilled Models) مثل R1-Distill-Llama-70B وR1-Distill-Qwen-32B على العديد من النماذج الأكبر حجمًا.
تمت هذه الاختبارات باستخدام بيانات تدريبية مُولدة بواسطة النموذج الأكبر R1، مما عزز من جودة النماذج الصغيرة.
تأتي هذه الإصدارات بعد إطلاق نموذج DeepSeek-V3، الذي أثبت أنه أحد أقوى النماذج المفتوحة المصدر عالميًا، منافسًا لنماذج شهيرة مثل GPT-4o.
مع هذه الابتكارات، تُظهر DeepSeek عزمها على تعزيز وجودها في سوق الذكاء الاصطناعي المتنامي، متخذة خطوات جريئة لتقديم نماذج مبتكرة بجودة عالية وأسعار تنافسية.