أصدرت شركة Stability AI نموذج Stable Video 4D، والذي ينقل تقنية إنشاء الفيديو إلى المستوى التالي. ويتميز النموذج الجديد بقدرته الفريدة على تحويل مقطع فيديو واحد إلى ثمانية مقاطع من زوايا مختلفة، مما يفتح آفاقا واسعة لصناعة السينما والألعاب وتطبيقات الواقع المعزز والافتراضي.
قال فارون جامباني، رئيس فريق بحث Stable AI 3D، إن Stable Video 4D يجمع بين أفضل نماذج Stable Video Diffusion وStable Video 3D السابقة ويحسنها بشكل جذري باستخدام مجموعة بيانات مدروسة للكائنات ثلاثية الأبعاد المتحركة.
ويعمل النموذج بأربعة أبعاد: العرض والارتفاع والعمق والزمن، مما يسمح برؤية الأجسام المتحركة من زوايا متعددة وفي لحظات زمنية مختلفة.
وأوضح غامباني أن Stable Video 4D يتفوق على النماذج السابقة من حيث آليات الانتباه، حيث أنه مصمم لتوليد كل إطار فيديو مع مراعاة الإطارات المجاورة من زوايا وأوقات مختلفة، مما يؤدي إلى تحسين ثلاثي الأبعاد في المقاطع المولدة.
يختلف هذا الأسلوب عن تقنيات التعبئة التوليدية التقليدية حيث يستخدم النموذج اللقطات الأصلية كمرجع لإنشاء ثمانية مقاطع من الصفر دون نقل اللقطات مباشرة.
وأشار غامباني إلى أن النموذج الحالي يمكنه معالجة مقاطع فيديو لكائن واحد بخلفية بسيطة في ثوانٍ، مع خطط لتوسيعه ليشمل مقاطع أطول ومشاهد أكثر تعقيدًا.
يتوفر Stable Video 4D حاليًا لتقييم الأبحاث على منصة Hugging Face، ولم تعلن Stable AI عن خطط تسويق مستقبلية للنموذج.
ذات صلة > OpenAI Sora: نموذج الذكاء الاصطناعي لتحويل النص إلى فيديو
المصدر