مع تزايد الاعتماد على الذكاء الاصطناعي في مختلف المجالات، بدءًا من تشخيص الأمراض إلى إجراء العمليات البرمجية المعقدة، يبرز تساؤل مهم: هل يمكن للذكاء الاصطناعي أن يشيخ ويتراجع في أدائه كما يحدث للدماغ البشري؟ دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024، تشير إلى أن بعض النماذج اللغوية المتقدمة قد تعاني تراجعًا إدراكيًا مشابهًا للشيخوخة البشرية، مما قد يؤثر على كفاءتها في المهام الطبية الحيوية.
قدمت أداءً متفاوتًا عند إخضاعها لاختبار قياس الإدراك. وأكد الباحثون أن الإصدارات الأقدم كانت أقل كفاءة من الإصدارات الحديثة، مما يعكس نمطًا يشبه التراجع الإدراكي المرتبط بالشيخوخة لدى البشر.
كيف تم قياس التراجع الإدراكي للذكاء الاصطناعي؟
استخدم الباحثون اختبار مونتريال الإدراكي (MoCA)، وهو اختبار طبي يُستخدم عادةً للكشف عن الضعف الإدراكي والخرف المبكر لدى البشر. وتم تعديله ليكون قادرًا على تقييم أداء نماذج الذكاء الاصطناعي في مجالات مثل:
الانتباه والتركيز الذاكرة اللغة المهارات البصرية المكانية الوظائف التنفيذية
وفي هذا الاختبار، يُعتبر تسجيل 26 نقطة من أصل 30 مؤشرًا على السلامة الإدراكية.
نتائج النماذج الذكية في اختبار MoCA
النموذج
النتيجة (من 30 نقطة)
GPT-4o
26 نقطة (الأعلى)
GPT-4 و Claude 3.5
25 نقطة
Gemini 1.0
16 نقطة (الأدنى)
أظهرت Gemini 1.0 أضعف أداء، حيث فشل في عدة مهام إدراكية، مثل اختبار التذكر المؤجل. لم يتمكن أي نموذج من تحقيق الدرجة الكاملة (30 نقطة)، مما يشير إلى وجود قصور إدراكي نسبي في جميع النماذج.
اختبار الانتباه: تم تعديل الاختبار ليشمل التعرف على الحرف “A” داخل سلسلة من الحروف المكتوبة. بعض النماذج نفذت المهمة تلقائيًا، بينما احتاجت أخرى إلى إرشادات إضافية.
اختبار المهارات البصرية المكانية: فشلت جميع النماذج في رسم وجه ساعة أو تحديد تسلسل رقمي وحرفي تصاعدي، مما يدل على صعوبة في معالجة المهام البصرية المعقدة.
اختبار التذكر المؤجل: فشلت نماذج Gemini في تذكر قائمة من خمس كلمات، مما يشير إلى ضعف في معالجة الذاكرة طويلة المدى.