مع التسارع اللافت في تطور نماذج الذكاء الاصطناعي، أصبحت المقارنة بين المنصات الكبرى مثل شات جي بي تي (ChatGPT) من شركة OpenAI وجيميني (Gemini) من غوغل أكثر تعقيدًا من أي وقت مضى. فالفروقات لم تعد تُقاس بسرعة الإجابة أو أسلوب الحوار فقط، بل بمدى القدرة على التفكير العميق، وحل المشكلات الواقعية، والتعامل مع تحديات معقدة تشبه ما يواجهه البشر, وفي نهاية عام 2025، انتشرت توقعات تشير إلى تراجع OpenAI في المنافسة، إلا أن إطلاق ChatGPT-5.2 أعاد ترتيب المشهد، ووضع شات جي بي تي مجددًا في صدارة عدد من الاختبارات المعيارية المعتمدة عالميًا.
3 اختبارات حاسمة تؤكد تفوق شات جي بي تي على جيميني في سباق الذكاء الاصطناعي

3 اختبارات حاسمة تؤكد تفوق شات جي بي تي على جيميني في سباق الذكاء الاصطناعي
تعتمد النماذج اللغوية الحديثة على آليات توليد احتمالية، ما يجعل الإجابة على سؤال واحد غير كافية للحكم على مستوى الذكاء الحقيقي. كما أن أسلوب المحادثة يمكن تخصيصه بسهولة، وهو ما يضعف قيمة المقارنات المبنية على تجربة فردية, ولهذا السبب، تُعد الاختبارات المعيارية (Benchmarks) الأداة الأكثر حيادية لقياس الأداء الفعلي، لأنها تقيّم قدرات محددة تحت شروط موحدة، بعيدًا عن الانطباعات الشخصية.
التفوق في التفكير العلمي المتقدم
أحد أبرز مجالات تفوق شات جي بي تي يتمثل في الإجابة عن الأسئلة العلمية المعقدة، كما يظهر في اختبار GPQA Diamond. هذا الاختبار مصمم لقياس مستوى التفكير العلمي في تخصصات مثل الفيزياء والكيمياء والأحياء، وبمستوى يوازي درجة الدكتوراه.
ويتميّز GPQA Diamond بأسئلته التي لا يمكن حلها عبر البحث السريع، بل تتطلب ربطًا دقيقًا بين المفاهيم وتجنب الأخطاء المنطقية. ووفق النتائج، حقق ChatGPT-5.2 نسبة 92.4%، متقدمًا بفارق محدود على Gemini 3 Pro الذي سجل 91.9%.
وللمقارنة، فإن متوسط أداء حملة الدكتوراه لا يتجاوز عادة 65%، بينما ينخفض لدى غير المتخصصين إلى نحو 34%، ما يعكس المستوى المتقدم للنموذجين، مع أفضلية طفيفة لصالح شات جي بي تي.
كفاءة أعلى في حل المشكلات البرمجية الواقعية
المعيار الثاني هو SWE-Bench Pro (النسخة الخاصة)، وهو اختبار يُعد من الأصعب في مجال البرمجة. يعتمد هذا المعيار على مشكلات حقيقية مأخوذة من بلاغات فعلية على منصة GitHub، ويقيس قدرة النموذج على فهم قواعد كود معقدة واقتراح حلول قابلة للتطبيق.
في هذا الاختبار، نجح ChatGPT-5.2 في حل نحو 24% من التحديات، مقابل 18% فقط لنموذج جيميني. ورغم أن هذه النسب تبدو محدودة، فإنها تُعد إنجازًا ملحوظًا في اختبار لا يزال البشر يتفوقون فيه بشكل شبه كامل.
أوكشنز أول منصة مزادات للأرقام المختصرة المميزة في مصر
تفوق واضح في التفكير التجريدي والبصري
أما المجال الثالث الذي يبرز فيه تفوق شات جي بي تي بوضوح فهو حل الألغاز البصرية التجريدية، كما يظهر في اختبار ARC-AGI-2. يركز هذا المعيار على استنتاج الأنماط من أمثلة محدودة، وهو نوع من التفكير لطالما كان حكرًا على البشر.
حقق ChatGPT-5.2 Pro نسبة 54.2% في هذا الاختبار، متفوقًا بفارق كبير على Gemini 3 Pro الذي سجل 31.1%، وحتى على نسخة Gemini 3 Deep Think الأعلى تكلفة، التي بلغت 45.1%.
تقنية Engram من ديب سيك قد تنهي أزمة الذاكرة في الذكاء الاصطناعي وتقلل الاعتماد على HBM المكلفة
منهجية الاختيار ودلالة النتائج
تم الاعتماد في هذه المقارنة على أحدث الإصدارات المدفوعة من النموذجين، مع اختيار ثلاثة معايير تمثل نطاقًا واسعًا من المهارات: التفكير العلمي، وحل المشكلات البرمجية، والتفكير التجريدي.
ورغم وجود اختبارات أخرى قد يتفوق فيها جيميني، فإن هذه النتائج تشير بوضوح إلى أن تفوق شات جي بي تي على جيميني لا يعتمد على تجربة عابرة، بل على أرقام ومعايير دقيقة.
وفي سباق لا يتوقف عند نموذج واحد، تؤكد هذه الجولة أن شات جي بي تي ما زال يمتلك أفضلية حقيقية في مجالات أساسية ترسم ملامح مستقبل الذكاء الاصطناعي.
مصر تُنهي إعفاء الهواتف المستوردة من الخارج تطبيق كامل للرسوم الجمركية بدءًا من الغد