العامية المصرية وخوارزميات فيسبوك
كشف تقرير حديث صادر عن
وكالة أسوشيتدبرس الاخبارية النقاب عن العديد من الوثائق الداخلية التي قامت موظفة
فيسبوك السابقة فرانسيس هوجين، بالإفصاح عنها أمام هيئة الأوراق المالية والبورصات الأمريكية.
والتي قامت 17 صحيفة أمريكية بنشرها تباعًا، ضمن سلسلة تحقيقات وتقارير عرفت بلإسم “أوراق فيسبوك”.
جاء ضمن الوثائق المسربة أن اللغة العربية كانت واحدة من التحديات التي تواجهها أنظمة الذكاء الاصطناعي في فيسبوك فيما يتعلق بإدارة ومراجعة المحتوى.
مما جعل فيسبوك توظف مزيد من المتحدثين باللغة العربية لمعالجة الأمر وفهم المحتوى العربي لتصنيف وتحييد المخالف منها لأنظمة المنصة الاجتماعية .
اعتقدت الشركة الأمريكية أن متحدثوا اللغة العربية يتقنون جميع اللهجات ، مما دعاهم لتوظيف معظم موظفيهم العرب من المغرب عبر مكتب إداري لإدارة المحتوى بمدينة الدار البيضاء.
لكن الأمر لم يُحدث أي تطور أو طفرة في تحسين خوارزميات فيسبوك في فهم المحتوى العربي بشكل صحيح.
تعدد اللهجات العامية للغة العربية لكل بلد
ويقول التقرير الذي نشرته
وكالة أسوشيتدبرس أنه الموظفون المعينون لمراقبة المحتوى العربي فشلوا في التصنيف الصحيح للمحتوى المخالف لسياسات الاستخدام.
وذلك بسبب كثرة وتعدد اللهجات العامية للغة العربية المميزة لكل بلد وعدم وضوح مخزى ومعنى بعض المصطلحات في هذه اللهجات.
ووفقًا لإحدى الوثائق، فقد فشل مراجعي المحتوى في ترجمة وفهم كلمات 30 لهجة عربية مختلفة.
وهو ما أدى إلى تصنيف 77% من هذه المنشورات على أنها محتوى إرهابي أو مخالفة لقواعد وسياسات فيسبوك.
وثيقة داخلية للفيسبوك
في حين أظهرت وثيقة داخلية أخرى أنه كانت هناك مشكلة في فهم اللغة العامية المصرية، ما أدى إلى تصنيف 90% من المنشورات المبلغ عنها بشكل غير صحيح من قبل مراجعي المحتوى العاملين في مكتب الدار البيضاء بالمغرب بأنها مخالفة.
وفي تصريح لوكالة أسوشييتد برس ، قال متحدث بإسم
Facebook إنه على مدار العامين الماضيين، استثمرت الشركة في تعيين المزيد من الموظفين ذوي الخبرة المحلية لتعزيز قدرتها على المراجعة اللغوية للهجات .
ولكن عندما يتعلق الأمر بتعديل المحتوى العربي، قالت الشركة: “لا يزال أمامنا المزيد من العمل للقيام به، فنحن نجري بحثًا لفهم هذا التعقيد بشكل أفضل وتحديد كيف يمكننا تحسينه.