أخبار تقنية

مقارنة شاملة بين o3-mini و DeepSeek-R1 أيهما الأفضل

Published

on

أطلقت OpenAI نموذجها الجديد o3-mini، المتاح لجميع مستخدمي ChatGPT، وذلك بعد وقت قصير من إصدار DeepSeek-R1، النموذج الصيني الذي أحدث ضجة كبيرة بفضل قدراته المتقدمة وتكلفته المنخفضة. ومنذ ذلك الحين، بدأ المهتمون بمجال الذكاء الاصطناعي في عقد المقارنات بين هذين النموذجين، لا سيما في الأداء والسعر.

مقارنة شاملة بين o3-mini و DeepSeek-R1 أيهما الأفضل

نتائج اختبار LiveBench

يُعد LiveBench أحد الاختبارات المعيارية المهمة لقياس أداء النماذج اللغوية الكبيرة (LLMs) في مجالات متعددة مثل البرمجة، والرياضيات، وتحليل البيانات، والاستدلال المنطقي.

مقارنة شاملة بين o3-mini و DeepSeek-R1 أيهما الأفضل

1. الأداء العام

2. التفكير والاستدلال المنطقي

  • o3-mini: 89.58 نقطة
  • DeepSeek-R1: 83.17 نقطة

o3-mini أكثر قدرة على التحليل والتفكير المنطقي.

3. البرمجة

  • o3-mini: 82.74 نقطة
  • DeepSeek-R1: 66.74 نقطة
    يتفوق o3-mini بشكل ملحوظ في فهم الأكواد وحل المشكلات البرمجية.

4. الرياضيات

5. تحليل البيانات

  • o3-mini: 70.64 نقطة
  • DeepSeek-R1: 69.78 نقطة
    o3-mini يتفوق بفارق بسيط في معالجة البيانات.

6. المهارات اللغوية

  • o3-mini: 50.68 نقطة
  • DeepSeek-R1: 48.53 نقطة
    o3-mini يتفوق بشكل طفيف في المهام اللغوية.

7. فهم المعلومات

  • o3-mini: 84.36 نقطة
  • DeepSeek-R1: 80.51 نقطة
    o3-mini يتميز بدقة أعلى في فهم وتحليل البيانات النصية.

اختبارات إضافية: كيف يواجه كل نموذج التحديات؟

اختبار NYT Connections لحل الألغاز

  • o3-mini: 72.4 نقطة
  • DeepSeek-R1: 54.4 نقطة
    يتفوق o3-mini بفارق 18 نقطة، مما يجعله أفضل في فهم الروابط بين المفاهيم.

اختبار Humanity’s Last Exam لقياس الدقة

التكلفة: أي النموذجين أكثر اقتصادية؟

النموذج سعر كل مليون رمز إدخال سعر كل مليون رمز إخراج
o3-mini $0.55 $4.40
DeepSeek-R1 $0.14 $2.19

DeepSeek-R1 أقل تكلفة، مما يجعله خيارًا مثاليًا لمن يبحثون عن نموذج اقتصادي.

Trending

Exit mobile version