عندما تخضع نماذج لتدريب مستمر باستخدام بيانات الذكاء الاصطناعي يتم توليدها بوساطة التقنية نفسها تبدأ هذه النماذج في عرض محتويات متضاربة بشكل متزايد وهذه الظاهرة تعد مشكلة معروفة وتتناولها العديد من الدراسات العلمية.
النماذج التي تعتمد على الذكاء الاصطناعي التوليدي مثل تشات جي بي تي تتطلب تدريب باستخدام كميات ضخمة من البيانات وتجمع هذه البيانات غالبا من الإنترنت حيث تنتشر صور ونصوص منتجة بوساطة الذكاء الاصطناعي وتعرف هذه العملية بظاهرة الالتهام الذاتي حيث يتغذى الذكاء الاصطناعي على بيانات تم إنشاؤها بوساطته مما يؤدي إلى تدهور جودة النموذج تدريجيا ويجعل النتائج التي يقدمها غير منطقية.
واستخدام بيانات الذكاء الاصطناعي اصطناعية أي تلك التي تنتج بواسطة الآلات يقلل من تنوع وغنى العينات التي تستمد منها نماذج الذكاء الاصطناعي معطياتها وهذا يشبه إلى حد كبير عملية نسخ صورة باستخدام الماسح الضوئي حيث تتدهور الجودة مع كل عملية نسخ وإعادة طباعة حتى تصبح النتيجة غير واضحة.
توصل الباحثون من جامعتي رايس وستانفورد إلى نتائج مماثلة بعد دراسة نماذج الذكاء الاصطناعي التي تولد الصور مثل ميدجورني ودال – إي وستيبل ديفيوجن ووجدوا أن الصور التي تنتج تصبح غير متسقة أكثر كلما أضيفت بيانات الذكاء الاصطناعي المنتجة وشبه الباحثون هذه الظاهرة بوباء جنون البقر الذي نشأ في المملكة المتحدة نتيجة استخدام علف حيواني مصنوع من أجزاء جيف الأبقار المصابة.
تُستخدم بيانات الذكاء الاصطناعي الاصطناعية في تدريب برامج الذكاء الاصطناعي نظرا لسهولة الحصول عليها وتكلفتها المنخفضة مقارنة بالبيانات التي يبتكرها البشر ولكن كما أشار جاثان سادوفسكي المتخصص في التقنيات الجديدة بجامعة موناش في أستراليا فإن مصادر البيانات البشرية عالية الجودة التي يمكن قراءتها آليا تصبح أكثر ندرة.