ChatGPT في البرمجة بين الدعم والتحديات

شهد روبوت ChatGPT تطورًا ملحوظًا في مهارات إنتاج الأكواد البرمجية، مما أثار اهتمام الباحثين والمطورين حول العالم. ومع ذلك، لا تزال هناك تساؤلات حول موثوقيته في المهام البرمجية، وقدرته على اكتشاف الأخطاء وتصحيحها. في هذا المقال، نستعرض دراسة حديثة أجرتها جامعة جيجيانغ حول أداء ChatGPT في البرمجة، مع التركيز على التحديات والتحسينات الممكنة.

جدول المحتويات إخفاء

1 ChatGPT في البرمجة بين الدعم والتحديات

1.1 القدرة على التحقق من دقة الأكواد البرمجية

1.2 الهلوسة المتناقضة: تحدٍ جديد

1.3 مقارنة أداء GPT-4 بـ GPT-3.5

1.4 توصيات وتحذيرات

ChatGPT في البرمجة بين الدعم والتحديات

أظهرت الدراسة التي قادتها الأستاذة المساعدة Xing Hu نتائج متباينة عند اختبار نموذج GPT-3.5 في إنشاء الأكواد البرمجية. وأبرز النتائج:

ChatGPT في البرمجة بين الدعم والتحديات

معدل نجاح 57% في إنتاج أكواد صحيحة تؤدي المهام المطلوبة.
معدل نجاح 73% في إنشاء أكواد خالية من الثغرات الأمنية.
معدل نجاح 70% في إصلاح الأخطاء البرمجية.

على الرغم من هذه النتائج الإيجابية نسبيًا، إلا أن الأداء كان دون المستوى المطلوب في بعض الحالات، مما يشير إلى وجود تحديات تستدعي الحذر.

القدرة على التحقق من دقة الأكواد البرمجية

ركز الباحثون في الدراسة على تقييم قدرة ChatGPT على التحقق من صحة الأكواد البرمجية التي ينتجها باستخدام طريقتين:

سامسونج تطلق ميزة جديدة لتنظيم الإشعارات في تحديث One UI 7

المطالبات المباشرة:

- تضمنت توجيه أسئلة مباشرة للنموذج حول صحة الكود.
- معدل الخطأ في تقييم الأكواد الصحيحة بلغ 39%.
- أخطاء التقييم المتعلقة بالأمان وصلت إلى 25%.
- نسبة الخطأ في تقييم إصلاحات الكود بلغت 28%.

الأسئلة التوجيهية:

- تضمنت أسئلة موجهة لتسليط الضوء على نقاط محددة في الكود.
- ساهمت هذه الطريقة في تحسين دقة ChatGPT، حيث:
  - ارتفعت نسبة اكتشاف الأخطاء بمعدل 25%.
  - تحسنت القدرة على اكتشاف الثغرات الأمنية بنسبة 69%.
  - زادت دقة تقييم إصلاح الكود بنسبة 33%.

الهلوسة المتناقضة: تحدٍ جديد

كشفت الدراسة عن ظاهرة أطلق عليها الباحثون اسم “الهلوسة المتناقضة ذاتيًا”، حيث:

ينشئ ChatGPT أكوادًا برمجية ويصنفها بأنها صحيحة أو آمنة.
يناقض هذا التصنيف لاحقًا أثناء التحقق الذاتي، مما يعكس عدم اتساق في التحليل.
نموذج الذكاء الاصطناعي O1 يتفوق على الأطباء في تشخيص الحالات المعقدة

مقارنة أداء GPT-4 بـ GPT-3.5

عند اختبار نموذج GPT-4، أظهرت النتائج تحسنًا في إنشاء وإصلاح الأكواد مقارنة بـ GPT-3.5، ولكن المشكلة الأساسية المتعلقة بالتحقق الذاتي ظلت قائمة:

استمر GPT-4 في تصنيف الأكواد غير الصحيحة أو غير الآمنة بشكل خاطئ.
ظهرت حالات من الهلوسة المتناقضة في تقييمات GPT-4 أيضًا.
أسوس تطلق أخف حاسوب محمول من فئة كوبايلوت بلس بمعرض CES 2025

توصيات وتحذيرات

أكدت البروفيسورة Xing Hu أن ChatGPT يجب أن يُستخدم كأداة داعمة للمطورين، وليس كبديل لهم، مع ضرورة تقييم مخرجاته بعناية. يمكن أن يساهم ChatGPT في:

تسريع إنشاء النماذج الأولية.
اقتراح حلول للمشكلات البرمجية.

ومع ذلك، يبقى القرار النهائي حول جودة الأكواد وسلامتها مسؤولية المطور البشري.

موقع أخبار هاي تك

الذكاء الاصطناعي

ChatGPT في البرمجة بين الدعم والتحديات

ChatGPT في البرمجة بين الدعم والتحديات

القدرة على التحقق من دقة الأكواد البرمجية

الهلوسة المتناقضة: تحدٍ جديد

مقارنة أداء GPT-4 بـ GPT-3.5

توصيات وتحذيرات

Trending