كشفت دراسة حديثة أجراها باحثون في OpenAI أن نماذج الذكاء الاصطناعي، رغم تطورها الكبير، ما تزال غير قادرة على حل معظم المشكلات البرمجية بنفس كفاءة المبرمجين البشر. وجاءت هذه النتائج رغم تصريح الرئيس التنفيذي سام ألتمان سابقًا بأن هذه النماذج قد تتفوق على مهندسي البرمجيات المبتدئين بحلول نهاية العام.
الذكاء الاصطناعي والبرمجة هل تتفوق النماذج المتطورة على البشر
في إطار البحث، اختبر العلماء قدرة نماذج الذكاء الاصطناعي على التعامل مع 1400 مهمة برمجية معقدة، مستمدة من منصة العمل الحر Upwork، وذلك باستخدام معيار جديد يُدعى SWE-Lancer. وشمل الاختبار ثلاثة نماذج رئيسية:
الذكاء الاصطناعي والبرمجة هل تتفوق النماذج المتطورة على البشر
اتخاذ قرارات استراتيجية في إدارة المشاريع البرمجية
ولضمان دقة النتائج، لم يُسمح للنماذج بالوصول إلى الإنترنت، مما حال دون اعتمادها على حلول جاهزة أو أمثلة منشورة سابقًا.
نتائج مخيبة للآمال في إصلاح الأكواد البرمجية
أظهرت النماذج صعوبة كبيرة في التعامل مع المشكلات البرمجية، حيث تمكنت فقط من إصلاح الأخطاء البسيطة، لكنها عجزت عن تحليل المشكلات الجذرية في المشاريع الكبيرة. ورغم تفوقها على البشر من حيث السرعة، فإن دقتها كانت أقل، مما أدى إلى حلول غير مكتملة أو غير صحيحة.
من بين النماذج المختبرة، سجل Claude 3.5 Sonnet أفضل أداء، لكنه لا يزال بعيدًا عن تحقيق دقة موثوقة. وخلص الباحثون إلى أن الذكاء الاصطناعي بحاجة إلى مزيد من التطوير قبل أن يصبح بديلًا حقيقيًا للمبرمجين في المهام المعقدة.
رغم التقدم السريع في تقنيات الذكاء الاصطناعي، تؤكد الدراسة أن هذه النماذج لم تصل بعد إلى مستوى مهندسي البرمجيات البشر، خاصة في المشاريع البرمجية المعقدة. ورغم ذلك، بدأت بعض الشركات بتقليص عدد المبرمجين البشريين لصالح الذكاء الاصطناعي، حتى مع افتقاره للدقة الكافية في هذه المهام.