أعلنت شركة OpenAI عن إطلاق نموذج جديد لتوليد الفيديو يسمى “Sora”. وبحسب الشركة فإن النموذج “قادر على خلق سيناريوهات واقعية وخيالية بناء على تعليمات مكتوبة”.
يتيح قالب تحويل النص إلى فيديو للمستخدمين إنشاء مقطع فيديو واقعي يصل إلى دقيقة واحدة بناءً على الأوامر النصية التي يدخلونها.
وفقًا للمنشور الرسمي، فإن عارضات Sora قادرات على إنشاء “مشاهد معقدة بشخصيات متعددة، وأنواع محددة من الحركة، وتفاصيل دقيقة للموضوعات والخلفيات”.
وتشير الشركة أيضًا إلى أن النموذج يمكنه فهم “كيفية وجود الأشياء في العالم المادي”، بالإضافة إلى “تفسير الدعائم بدقة وإنشاء شخصيات جذابة تعبر عن مشاعر واقعية”.
بالإضافة إلى ذلك، يمكن للنموذج إنشاء مقاطع فيديو بناءً على الصور الثابتة، بالإضافة إلى ملء الإطارات المفقودة في مقاطع الفيديو الموجودة أو توسيعها.
تشتمل العروض التوضيحية التي تم إنشاؤها باستخدام OpenAI Sora على مناظر جوية لولاية كاليفورنيا أثناء حمى البحث عن الذهب، ومقطع فيديو يبدو أنه تم تصويره داخل قطار في طوكيو، والمزيد.
تجدر الإشارة إلى أن العديد من هذه العروض التوضيحية تحمل بعض الدلائل على أنها تم إنشاؤها بواسطة الذكاء الاصطناعي، مثل الأرضيات المتحركة بشكل مثير للريبة في فيلم المتحف.
يقول OpenAI إن النموذج “قد يواجه صعوبة في محاكاة فيزياء السيناريوهات المعقدة بدقة”، لكن النتائج الإجمالية مثيرة للإعجاب.
قد تكون مهتمًا > الذكاء الاصطناعي ChatGPT يكتسب الذكريات لتحسين سياق المحادثة
قبل بضع سنوات، كانت أدوات تحويل النص إلى صورة مثل Midjourney في طليعة تحويل النص إلى صور.
ولكن في الآونة الأخيرة، بدأ الفيديو في التقدم بمعدل ينذر بالخطر: فقد أظهرت شركات مثل رنواي وبيكا نماذج مبهرة لتحويل النص إلى فيديو، ومن المتوقع أن تصبح شركة لوميير من جوجل واحدة من المنافسين الرئيسيين لشركة أوبن إيه آي في هذا المجال.
على غرار Sora، يوفر Lumiere للمستخدمين أدوات تحويل النص إلى فيلم ويسمح لهم بإنشاء أفلام من الصور الثابتة.
نموذج Sora متاح حاليًا فقط لـ “فرق التقييم” التي تقوم بتقييم المخاطر والمخاطر المحتملة للنموذج.
يوفر OpenAI أيضًا اتصالات مع عدد من الفنانين التشكيليين والمصممين وصانعي الأفلام للحصول على تعليقاتهم.
في وقت سابق من هذا الشهر، أعلنت شركة OpenAI أنها ستضيف علامات مائية إلى أداة تحويل النص إلى صورة DALL-E 3، لكنها أشارت إلى أنه “يمكن إزالتها بسهولة”.
مثل منتجات الذكاء الاصطناعي الأخرى، سيتعين على OpenAI التعامل مع عواقب الخلط بين مقاطع الفيديو المزيفة التي تم إنشاؤها بواسطة الذكاء الاصطناعي ومقاطع الفيديو الحقيقية.
بعض المقاطع الناتجة:
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
– سام التمان (@ سما) 15 فبراير 2024
https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b
– سام التمان (@ سما) 15 فبراير 2024
إليك خيار أفضل: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
– سام التمان (@ سما) 15 فبراير 2024
https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
– سام التمان (@ سما) 15 فبراير 2024
المصدر