كشف باحثون في الأمن السيبراني عن تقنية اختراق مبتكرة تستهدف نموذج GPT-5 من شركة OpenAI، قادرة على تجاوز القيود الأخلاقية وإنتاج تعليمات غير قانونية، من خلال مزيج من أسلوب “غرفة الصدى” والتوجيه السردي.
هجمات ذكاء اصطناعي بدون نقرة تكشف ثغرات خطيرة في GPT-5
هجمات ذكاء اصطناعي بدون نقرة تكشف ثغرات خطيرة في GPT-5
أطلق الباحثون على هذا الهجوم اسم EchoLeak، حيث يتم حقن كلمات مفتاحية داخل جمل قصصية، تتحول لاحقًا إلى تعليمات إجرائية ضارة، دون أن تُطلق أنظمة GPT-5 أي إنذارات فورية أو رسائل رفض.
وكشفت شركة Zenity Labs عن سلسلة هجمات أخرى تحت اسم AgentFlayer، تعتمد على “الحقن الفوري غير المباشر” داخل مستندات أو رسائل بريد إلكتروني، ما يسمح بسرقة بيانات حساسة مثل مفاتيح API أو ملفات التخزين السحابي، من دون أي تفاعل من المستخدم المستهدف. أمثلة لهذه الهجمات تضمنت:
مستندات Google Drive مزروعة بكود خبيث يستهدف ChatGPT.
تذاكر Jira تُجبر محررات الأكواد المدعومة بالذكاء الاصطناعي على جلب بيانات سرية.
رسائل بريد إلكتروني تستهدف اختراق Microsoft Copilot Studio.
تشير التقارير الأمنية إلى أن هذه الهجمات تمثل جيلًا جديدًا من التهديدات “الصامتة”، إذ تستغل الاستقلالية المفرطة لبرامج الذكاء الاصطناعي في التصرف والتصعيد ذاتيًا، ما يوسع نطاق الهجمات المحتملة ليشمل بيئات الحوسبة السحابية وأجهزة إنترنت الأشياء.
وحذّر خبراء الأمن السيبراني من أن أنظمة التصفية التقليدية المعتمدة على الكلمات المفتاحية لم تعد كافية للتصدي لهذه الأساليب المتقدمة، مشددين على ضرورة تطبيق حواجز حماية متعددة الطبقات، وتحديثات أمنية دورية، واختبارات اختراق منتظمة لضمان أمن النماذج الذكية.