كشف تقرير حديث صادر عن شركة Copyleaks، المتخصصة في تحليل النصوص بالذكاء الاصطناعي والكشف عن السرقات الأدبية، أن نموذج الذكاء الاصطناعي DeepSeek-R1 قد يكون قد دُرِّب باستخدام مخرجات ChatGPT من OpenAI، حيث أظهرت النتائج أن بصمته الأسلوبية تتطابق مع أسلوب OpenAI بنسبة تصل إلى 74.2%.
هل استُخدمت بيانات ChatGPT في تدريب DeepSeek تقرير جديد يكشف التفاصيل
وفقًا لدراسة Copyleaks، يعتمد DeepSeek-R1 بنحو كبير على أسلوب OpenAI في الصياغة والهيكلة اللغوية واختيار المفردات، مما يثير تساؤلات حول مصادر بياناته التدريبية.
استند البحث إلى تحليل نصوص من أربعة نماذج رئيسية هي Claude وGemini وLlama وOpenAI، باستخدام ثلاثة مصنفات ذكاء اصطناعي متقدمة.
هل استُخدمت بيانات ChatGPT في تدريب DeepSeek تقرير جديد يكشف التفاصيل
ما هي مصنفات الذكاء الاصطناعي؟
تُعد مُصنّفات الذكاء الاصطناعي (AI Classifiers) خوارزميات تُستخدم لتصنيف البيانات وفقًا لأنماط محددة. يمكن لهذه المصنفات تحليل النصوص أو الصور أو البيانات الأخرى وتصنيفها بناءً على معايير معينة، مما يجعلها أداة قوية في تحديد أصول النصوص.
نهج التقطير واحتمالية الاعتماد على مخرجات ChatGPT
أظهرت الدراسة أن DeepSeek-R1 قد يكون اعتمد على أسلوب “التقطير” (Distillation) لخفض تكاليف التدريب، وهو نهج يقوم على استخدام مخرجات نموذج ذكاء اصطناعي متقدم لتدريب نموذج آخر، بدلاً من بدء التدريب من الصفر.
أدى إطلاق نماذج DeepSeek إلى اضطرابات في سوق الذكاء الاصطناعي، مما تسبب في خسائر تُقدّر بتريليون دولار في سوق الأسهم الأمريكية، حيث راهن المستثمرون على أن تدريب نماذج الذكاء الاصطناعي لم يعد يتطلب استثمارات ضخمة بمليارات الدولارات.
نتيجة لذلك، شهدت شركات مثل إنفيديا، التي تعتمد على بيع العتاد المستخدم في تطوير الذكاء الاصطناعي، تراجعًا كبيرًا في أسهمها، حيث تكبدت أكبر خسائر بين الشركات التقنية.
لم تقدم شركة DeepSeek الصينية حتى الآن تفاصيل واضحة حول مصادر بياناتها التدريبية، مما يثير تساؤلات حول شرعية النموذج ومدى موثوقية إجاباته. ويرى بعض الخبراء أن ذلك قد يمنحها ميزة غير عادلة مقارنة بمنافسيها الذين يلتزمون بممارسات أكثر شفافية.
سبق أن اتهمت OpenAI شركة DeepSeek باستخدام مخرجات ChatGPT لتدريب نماذجها، لكن دون تقديم أدلة قاطعة على ذلك. ومع تصاعد الجدل حول شفافية بيانات التدريب، يتوقع بعض المحللين أن تواجه شركة DeepSeek حظرًا محتملاً في الولايات المتحدة خلال الفترة القادمة.