أخبار الانترنت

مراجعة تقنية: كيف يقوم نموذج GPT-4 من OpenAI بتحليل وتوليف محتوى يوتيوب؟

Published

on

أفادت صحيفة  نيويورك تايمز الأمريكية  بأن شركة OpenAI درّبت نموذج  الذكاء الاصطناعي GPT-4 يعمل على معالجة المحتويات الموجودة على منصة يوتيوب.

ذكرت الجريدة أن الشركة كانت محتاجة بشدة لداتا التدريب، وقامت بتطوير نظام Whisper لتحويل الكلام في مقاطع الفيديو المتاحة على يوتيوب إلى كتابة، ليتم بعدها استغلالها في تدريب الإصدار GPT-4، الذي يعتبر من أبرز إصداراتها حاليًا.

تلك العملية تثير تساؤلات متعلقة بالجانب القانوني وتقع في منطقة مبهمة بما يتعلق بقانون حقوق الملكية الفكرية والتأليف للذكاء الاصطناعي، لكن الجريدة ذكرت أن OpenAI تعتبر ذلك في إطار “الاستخدام المنصف”.

زعمت الجريدة أن جريج بروكمان، رئيس شركة OpenAI، شخصيًا شارك في تجميع مقاطع الفيديو التي تم استعمالها لأغراض التدريب.

صرحت ليندساي هيلد، المتحدثة بإسم OpenAI، لموقع The Verge المتخصص في التكنولوجيا بأن الشركة تعتمد على مجموعة متنوعة من المصادر في جمع البيانات، بما في ذلك البيانات المتوفرة للعامة وكذلك تلك البيانات الخاصة التي تحصل عليها عبر شراكات معينة.

في عام 2021، قامت الشركة بتدريب نماذجها على جميع موارد البيانات المفيدة، واستكشافت مفهوم تحويل المحتوى المرئي والصوتي مثل مقاطع الفيديو، البودكاست، والكتب المسموعة المتوفرة على يوتيوب إلى نصوص، باعتبارها من أفضل المصادر المتاحة للمعلومات.

في تلك الفترة، قامت الشؤون بتدريب النماذج الخاصة بها على مجموعة بيانات شملت الشيفرات البرمجية الموجودة في منصة Github، بالإضافة إلى المحتوى الدراسي الموجود في منصة Quizlet ومصادر أخرى.

أفادت الصحيفة بأن مسؤولين في شركة جوجل كانوا مطلعين على أنشطة شركة OpenAI، إلا أنهم لم يقدموا على اتخاذ خطوات ضدها. وذكرت أن سبب ذلك يرجع إلى استعانة جوجل بنفسها بمقاطع الفيديو المتاحة على يوتيوب في سياق تطوير النماذج الخاصة بالذكاء الاصطناعي لديها.

ذكرت جوجل للجريدة أنها تقوم بهذا الإجراء فقط بالنسبة لمقاطع الفيديو التي يمتلكها صنّاع المحتوى الذين أعطوا موافقتهم على ذلك.

مؤخرًا، نبّه المدير التنفيذي ليوتيوب شركة OpenAI بخصوص تطوير نموذجهم الأحدث لتحويل الكتابات إلى مقاطع فيديو، باستخدام الفيديوهات المُتاحة على الموقع.

 

Trending

Exit mobile version