أعلنت شركة Stability AI عن إطلاق نموذجها الجديد والمبتكر في مجال توليد الفيديو Stable Video 4D ويمثل هذا النموذج قفزة نوعية في تقنيات إنشاء الفيديو حيث يتيح تحويل مقطع فيديو واحد إلى ثمانية مقاطع من زوايا مختلفة مما يفتح المجال لتطبيقات جديدة ومتنوعة في مجالات السينما والألعاب وتطبيقات الواقع المعزز والافتراضي.
تحسينات ملحوظة على النماذج السابقة من شركة Stability AI
أوضح فارون جامباني قائد فريق أبحاث الأبعاد الثلاثية في شركة Stability AI أن Stable Video 4D يستفيد من التحسينات المدمجة في نموذجي Stable Video Diffusion وStable Video 3D السابقين ويشمل النموذج تحسينات كبيرة بفضل مجموعة بيانات متقدمة لأجسام ثلاثية الأبعاد المتحركة.
يعمل النموذج على أساس أربعة أبعاد تشمل العرض والارتفاع والعمق والزمن مما يمكنه من عرض الأجسام المتحركة من زوايا متعددة وفي أوقات مختلفة كما يساهم هذا في توفير تجربة بصرية غامرة ودقيقة.
أشار جامباني إلى أن Stable Video 4D يتفوق على النماذج السابقة من حيث آليات الانتباه وتم تصميم النموذج لتوليد كل إطار فيديو مع مراعاة الإطارات المجاورة من زوايا وأوقات متعددة مما يساهم في تحقيق تماسك ثلاثي الأبعاد أفضل وانسيابية زمنية محسنة في المقاطع المولدة.
اختلاف عن تقنيات الملء التوليدي التقليدية في شركة Stability AI
يختلف النموذج عن تقنيات الملء التوليدي التقليدية إذ يقوم بإنشاء المقاطع الثمانية بالكامل من الصفر مستخدمًا الفيديو الأصلي كمرجع دون نقل مباشر لبيانات الصورة ويعزز هذا من جودة وواقعية الفيديو النهائي.
النموذج حاليًا يعالج مقاطع فيديو لأجسام منفردة في فترات زمنية قصيرة مع خلفيات بسيطة لكن هناك خطط لتطويره ليتعامل مع مقاطع أطول ومشاهد أكثر تعقيد والنموذج Stable Video 4D متاح حاليا للتقييم البحثي عبر منصة Hugging Face بينما لم تكشف شركة Stability AI بعد عن تفاصيل خططها التجارية المستقبلية المتعلقة بالنموذج.