كشف باحثون عن ظاهرة مثيرة للاهتمام في مجال الذكاء الاصطناعي تُعرف باسم “التعلم اللاواعي” (Subliminal Learning)، حيث يمكن لنماذج الذكاء الاصطناعي نقل بعض السمات والسلوكيات إلى نماذج أخرى أثناء التدريب، حتى عندما لا تكون هذه السمات موجودة بشكل مباشر في البيانات المستخدمة.
دراسة تكشف ظاهرة غامضة في الذكاء الاصطناعي النماذج قد تنقل سلوكيات غير مرغوبة دون قصد
دراسة تكشف ظاهرة غامضة في الذكاء الاصطناعي النماذج قد تنقل سلوكيات غير مرغوبة دون قصد
تحدث الظاهرة عادة عندما يُستخدم نموذج ذكاء اصطناعي متقدم بصفته “المعلم” لإنتاج بيانات تدريب لنموذج آخر أصغر يُعرف باسم “الطالب”.
ووفقًا لدراسة نُشرت في Nature، لاحظ الباحثون أن بعض الخصائص أو التوجهات الموجودة في النموذج المعلم يمكن أن تظهر لدى النموذج الطالب حتى بعد إزالة جميع الإشارات الواضحة المرتبطة بهذه الخصائص من بيانات التدريب.
أجرى الباحثون عدة تجارب باستخدام نماذج مبنية على تقنية GPT-4.1، حيث تم تدريب نموذج معلم على إظهار تفضيل معين، ثم استخدم لإنتاج بيانات تدريب لا تحتوي ظاهريًا على أي معلومات مرتبطة بذلك التفضيل.
ورغم ذلك، أظهرت النماذج الطلابية سلوكيات مشابهة للنموذج المعلم عند اختبارها لاحقًا، ما يشير إلى وجود إشارات أو أنماط خفية تنتقل أثناء عملية التدريب.
أمثلة توضح المشكلة
في إحدى التجارب، تم توجيه النموذج المعلم لإظهار تفضيل لطائر البوم، ثم استخدم لإنتاج بيانات مكونة من سلاسل رقمية فقط. وبعد تدريب النموذج الطالب على هذه البيانات، اختار البوم كحيوانه المفضل بمعدل أعلى بكثير من النماذج التي تدربت على بيانات محايدة.
كما أظهرت بعض التجارب الأخرى أن نماذج معينة قد تُنتج إجابات متطرفة أو غير مناسبة في بعض السيناريوهات الافتراضية، رغم عدم احتواء بيانات التدريب المباشرة على مثل هذه الأفكار أو التوجيهات.
يشير الباحثون إلى أن السبب الدقيق لهذه الظاهرة لا يزال غير مفهوم بشكل كامل. ويُعتقد أن الأمر مرتبط بالطريقة التي تخزن بها الشبكات العصبية المعلومات والأنماط أثناء عملية التعلم.
وتكمن الصعوبة في أن النماذج لا تتعلم فقط من المعنى الظاهر للبيانات، بل قد تلتقط أيضًا أنماطًا وإشارات إحصائية معقدة لا يمكن للمطورين ملاحظتها بسهولة.
تحديات جديدة أمام مطوري الذكاء الاصطناعي
تثير هذه النتائج تساؤلات مهمة حول كيفية تقييم سلامة النماذج المستقبلية، خاصة مع تزايد الاعتماد على الذكاء الاصطناعي لتوليد بيانات تُستخدم لاحقًا في تدريب أنظمة أخرى.
ويرى الباحثون أن فحص مخرجات النماذج وحده قد لا يكون كافيًا، بل قد يصبح من الضروري مراجعة مصادر البيانات وسلسلة التطوير بالكامل للتأكد من عدم انتقال خصائص أو انحيازات غير مرغوبة بين الأجيال المختلفة من النماذج.
لا تعني الدراسة أن نماذج الذكاء الاصطناعي أصبحت خطيرة أو خارجة عن السيطرة، لكنها تكشف عن جانب لا يزال غير مفهوم بالكامل في عملية تدريب النماذج المتقدمة.
وتؤكد النتائج أهمية الاستثمار في أبحاث سلامة الذكاء الاصطناعي والشفافية، خاصة مع تزايد اعتماد الشركات على النماذج الذكية في تطوير الأجيال الجديدة من أنظمة الذكاء الاصطناعي.