في مؤتمرها السنوي Google I/O 2025 كشفت جوجل عن إطلاق الجيل الثالث من نموذجها المتقدم لتوليد الفيديو بالذكاء الاصطناعي Veo 3، الذي يمثل نقلة نوعية في جودة الفيديو بإضافة مؤثرات صوتية وأصوات خلفية وحوارات متزامنة مع المشاهد المنتجة لأول مرة.
النموذج الجديد Veo 3 يتفوق بشكل واضح على الإصدار السابق Veo 2، حيث لا يقتصر التطور على تحسين جودة الصورة فقط، بل يشمل دمج الصوت بشكل كامل مع الفيديو ليمنح تجربة أكثر واقعية وتفاعلية. النموذج متاح حاليًا لمشتركي باقة AI Ultra بسعر 250 دولار شهريًا، ويمكن تشغيله عبر تعليمات نصية أو صور توضيحية.
ديميس هاسابيس الرئيس التنفيذي لشركة ديب مايند التابعة لجوجل أكد أن Veo 3 ينهي عصر الفيديوهات الصامتة، موضحًا أن المستخدم يمكنه وصف الشخصيات والمشاهد مع تحديد نبرة الصوت المطلوبة ليولد الفيديو بحوار متزامن. هذه الميزة الصوتية تمنح Veo 3 ميزة تنافسية وسط الزخم الكبير في مجال الفيديوهات المنتجة بالذكاء الاصطناعي، حيث يسعى الجميع لتقديم محتوى أكثر واقعية.
جوجل أوضحت أن النموذج قادر على تحليل البكسلات في الفيديو وربطها بالصوت بطريقة متزامنة تلقائيًا، ما يعزز من تماسك وواقعية الفيديو، ويعتمد على تقنيات متقدمة من أعمال ديب مايند في توليد المؤثرات الصوتية.
رغم عدم إعلان جوجل عن مصادر البيانات التي تدرب عليها النموذج، تشير التوقعات إلى أن يوتيوب قد يكون أحد المصادر الرئيسية، خاصة مع الإشارات السابقة التي تحدثت عن إمكانية استخدام محتوى يوتيوب في تدريب نماذج الذكاء الاصطناعي.
في مواجهة ظاهرة التزييف العميق تستخدم جوجل تقنية التوسيم الرقمي SynthID التي تدمج علامات غير مرئية ضمن كل إطار فيديو مولّد، ما يساعد في التعرف على المحتوى المصنوع بالذكاء الاصطناعي وضمان الشفافية.
بالتزامن مع إطلاق Veo 3 أطلقت جوجل تحديثات جديدة لنموذج Veo 2، تتيح إضافة صور للشخصيات والمشاهد لضمان اتساق المخرجات، مع إمكانية فهم حركات الكاميرا مثل الدوران والتقريب والإبعاد، بالإضافة إلى تعديل محتوى الفيديو بإضافة أو حذف عناصر.
هذه التحديثات الجديدة ستتوفر عبر منصة Vertex AI خلال الأسابيع القادمة لتوسيع خيارات المستخدمين في توليد الفيديوهات الذكية بدقة ومرونة أكبر.
إرسال تعليق