أصدرت شركة الذكاء الاصطناعي الناشئة Stability AI منتجًا جديدًا يحمل اسم "Stable Video Diffusion"، وهو يتيح للمستخدمين إنشاء فيديو من صورة واحدة.
وفي تصريح للشركة، قالت: "يعتمد نموذج توليد الفيديو بالذكاء الاصطناعي Stable Video Diffusion على نموذج توليد الصورة بالذكاء الاصطناعي Stable Diffusion، ويمثل هذا النموذج خطوة هامة في رحلتنا لتطوير نماذج شاملة تصل للجميع".
يتوفر الآن Stable Video Diffusion كمعاينة بحثية، ويتطلب من الراغبين في استخدام النموذج الموافقة على شروط استخدام محددة تحدد التطبيقات المقصودة لـ Stable Video Diffusion، مثل الأدوات التعليمية والإبداعية، بالإضافة إلى التطبيقات غير المقصودة مثل التمثيل الواقعي للأشخاص أو الأحداث.
وأوضحت Stability AI أن المستخدمين المحتملين يمكنهم التسجيل في قائمة الانتظار للحصول على الوصول إلى التجربة القادمة لواجهة تحويل النص إلى فيديو. وتعرض الأداة التطبيقات المحتملة في مجالات مثل الإعلان والتعليم والترفيه وغيرها. يتم توفير منتج Stable Video Diffusion في هذه المرحلة لأغراض البحث فقط، وليس للاستخدامات الواقعية أو التجارية.
تم إصدار الأداة الجديدة من قبل Stability AI في شكل نموذجين لتحويل الصورة إلى فيديو، حيث يتمكن كل نموذج من إنتاج ما بين 14 إطارًا و 25 إطارًا بسرعات تتراوح بين 3 إطارات في الثانية و 30 إطارًا في الثانية، وبدقة تبلغ 576×1024 بكسل.
يتمكن منتج Stable Video Diffusion من دمج متعدد تقنيات العرض في إطار واحد مع تعديل دقيق لمجموعات البيانات ذات التقنيات المتعددة.
وقد أشارت الشركة إلى أن "تقييمنا الخارجي أظهر أن هذه النماذج تفوقت على النماذج الرائدة المغلقة في دراسات تفضيلات المستخدم"، وذلك في مقارنة مع منصات تحويل النص إلى فيديو مثل Runway و Pika Labs.
تنتج الأداة مقاطع فيديو ذات جودة نسبية عالية وتتوافق مع أنظمة التوليد المنافسة، على الرغم من وجود بعض القيود؛ حيث يتم إنشاء فيديو قصير بمدة تبلغ 4 ثوانٍ يفتقر إلى الواقعية المثالية، ولا يمكن تحريك الكاميرا، ولا يوجد تحكم في النص أو إنشاء نص قابل للقراءة، وقد لا يتم إنشاء الوجوه والأشخاص بشكل صحيح.
قامت Stability AI بتدريب الأداة على مجموعة بيانات تحتوي على ملايين مقاطع الفيديو، وتم ضبطها في وقت لاحق باستخدام مجموعة صغيرة تتألف من مئات الآلاف من مقاطع الفيديو. وأشارت الشركة إلى أنها تستخدم مقاطع الفيديو المتاحة للجمهور لأغراض البحث.
تعد الفيديو هدفًا رئيسيًا للذكاء الاصطناعي التوليدي، نظرًا لقدرته على تسهيل عملية إنشاء المحتوى، ولكن هناك احتمالية كبيرة لسوء استخدامه من خلال التلاعب العميق وانتهاك حقوق النشر.
إرسال تعليق