أعلنت شركة Stability AI، الناشطة في مجال الذكاء الاصطناعي إصدار نموذج مفتوح المصدر جديد لإنتاج الأصوات.
وأكدت الشركة في بيانها الرسمي تم تدريب النموذج على تسجيلات خالية من حقوق الملكية، مستفيداً من حوالي 486 ألف عينة من مكتبات الأصوات المفتوحة المصدر مثل FreeSound و Free Music Archive.
يحمل النموذج اسم Stable Audio Open، ويعمل على تحويل النصوص إلى تسجيلات صوتية تصل مدتها إلى 47 ثانية.
وتشير شركة Stability AI إلى أن النموذج يمكن استعماله لتوليد الأصوات لأغراض متعددة، بما في ذلك الأفلام والبرامج التلفزيونية.
وأضافت الشركة أن إحدى الفوائد الرئيسية لهذا الإصدار المفتوح المصدر هي أن المستخدمين يمكنهم تحسين النموذج باستخدام بياناتهم الصوتية المخصصة. على سبيل المثال: يمكن للمستخدم تعديل النموذج باستخدام عينات من تسجيلاته الخاصة لإنشاء أصوات جديدة منها.
وتنصح الشركة المستخدمين الذين يرغبون في إنتاج أصوات أكثر تقدمًا باستخدام خدمة Stable Audio المميزة التي تقدّمها.
ولا يمكن استخدام نموذج Stable Audio Open لأغراض تجارية، وذلك استناداً إلى شروط الخدمة المحددة للنموذج. بالإضافة إلى ذلك، لا يعمل بنفس الكفاءة مع الأوامر النصية المكتوبة بلغات غير الإنجليزية، أو عند توليد مقاطع صوتية لا تتعلق ببيانات التدريب.
واجهت شركة Stability AI مؤخراً تحديات في تطوير منتجاتها، خصوصاً بعد استقالة نائب رئيس قسم الصوت التوليدي، إد نيوتن ريكس. وقد أرجع سبب استقالته إلى أن الشركة تقوم بتدريب نماذج الذكاء الاصطناعي التوليدي على أعمال محمية بحقوق الطبع والنشر.
تهدف الشركة من خلال هذا النموذج الجديد إلى حماية نفسها من الاتهامات المرتبطة بهذا الموضوع، وكذلك تسعى إلى الترويج لخدماتها المتطورة في إنتاج الأصوات باستخدام الذكاء الاصطناعي.
ومن المهم الإشارة إلى أن شركة سوني قد أرسلت في مايو الماضي خطابًا تحذيريًا إلى مئات الشركات التي تعمل في مجال الذكاء الاصطناعي التوليدي. “استخدام محتواها بدون إذن لتدريب مولدات الصوت.”