أخبار الشركات

جدل تقني حول أداء Llama 4 Maverick ميتا تُتهم بالتضليل في اختبار الذكاء الاصطناعي

Published

on

واجهت شركة ميتا (Meta) الأسبوع الماضي موجة من الانتقادات بعدما تبيّن أنها استخدمت نسخة تجريبية غير مُعلن عنها من نموذج الذكاء الاصطناعي Llama 4 Maverick في اختبار الأداء الشهير LM Arena. وقد أدى هذا الإجراء إلى نتائج غير دقيقة أثارت الجدل حول نزاهة التقييمات.

جدل تقني حول أداء Llama 4 Maverick ميتا تُتهم بالتضليل في اختبار الذكاء الاصطناعي

بعد اكتشاف أن النموذج الذي قدمته “ميتا” لا يعكس النسخة الأصلية من Llama 4 Maverick، أعلن القائمون على منصة LM Arena اعتذارهم الرسمي، مع تعديل سياساتهم الداخلية، وإعادة تقييم الأداء بناءً على النموذج الأصلي غير المعدل.

جدل تقني حول أداء Llama 4 Maverick ميتا تُتهم بالتضليل في اختبار الذكاء الاصطناعي

نتائج مخيبة للنموذج الأصلي مقارنة بالمنافسين

وفقًا لتقرير نشره موقع TechCrunch التقني، فقد أظهرت النتائج الجديدة أن أداء Maverick الأصلي كان أقل من توقعات السوق، ولم يتمكن من مجاراة نماذج مثل:

مما يدل على أن النسخة التجريبية التي استخدمتها “ميتا” سابقًا كانت تتمتع بتعديلات أدت إلى تحسّن مصطنع في نتائج الأداء.

ميتا تبرر: النموذج المُعدل “محسن للمحادثة”

صرّحت “ميتا” بأن النسخة التي استخدمتها في الاختبار، والتي تحمل الاسم الكامل Llama-4-Maverick-03-26-Experimental، تم تطويرها خصيصًا لتقديم أداء أفضل في المحادثات البشرية، وهو ما يفسر تفوقها في اختبارات LM Arena التي تعتمد على تقييم بشري.

هل يُعد التخصيص تضليلًا؟ جدل في مجتمع المطورين

أثار هذا التصرف نقاشًا واسعًا حول شفافية اختبارات الذكاء الاصطناعي، حيث إن تخصيص نموذج خصيصًا لاختبار معين قد يُعد مضللًا ويؤثر على قدرة المطورين على قياس الأداء الحقيقي للنموذج في تطبيقات الحياة الواقعية.

وأكد تقرير TechCrunch أن منصة LM Arena ليست معيارًا موثوقًا بالكامل، بسبب اعتمادها على التقييمات البشرية التي قد تتأثر بعوامل غير تقنية.

إطلاق النسخة المفتوحة المصدر: الكرة الآن في ملعب المطورين

اختتمت “ميتا” بيانها بالإشارة إلى أنها أطلقت النسخة مفتوحة المصدر من Llama 4، وتوقعت أن يعمل المطورون على تخصيص النماذج حسب احتياجاتهم الخاصة، في سياقات استخدام متنوعة.

Leave a Reply

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Trending

Exit mobile version