آخر الأخبار

ميتا تعلن عن نموذج Voicebox المبتكر لتحويل النص إلى كلام


 أعلنت شركة ميتا اليوم الجمعة عن ابتكارها الجديد في مجال الذكاء الاصطناعي التوليدي للكلام، وذلك في إطار المنافسة المتزايدة مع شركات التقنية الأخرى كجوجل ومايكروسوفت وأمازون.

وأوضحت ميتا في منشور على مدونتها أنها قامت بتطوير "فويس بوكس" (Voicebox)، وهو نموذج حديث من الذكاء الاصطناعي يتمتع بالقدرة على إنشاء الكلام من خلال تحرير النصوص وأخذ العينات والتحكم في الأسلوب، ويتميز بتمكنه من التعلم في السياق المحيط به لتحقيق أفضل النتائج.

صاغت عملاقة التقنية، التي تضم في طياتها فيسبوك وإنستاجرام وواتساب وغيرها، بأن (فويس بوكس) يمكنه إنتاج مقاطع صوتية عالية الجودة وتحرير الصوت المسجل سابقًا بإزالة أصوات مزعجة مثل صوت أبواق السيارات أو نباح الكلاب، وذلك بالحفاظ على جودة المحتوى ونبرة الصوت.

ويتميز (فويس بوكس) بأنه يتحدث عدة لغات ويمكنه إنتاج الكلام بست لغات.

وتؤمن ميتا بأنه في المستقبل، يمكن لنماذج الذكاء الاصطناعي متعددة الأغراض، مثل (فويس بوكس)، أن تعطي أصواتًا طبيعية لمساعدين افتراضيين وشخصيات في الميتافيرس وغيرها.

صاغت الشركة بأن هذه النماذج يمكنها مساعدة الأشخاص ضعاف البصر على سماع الرسائل المكتوبة من أصدقائهم بأصواتهم، كما يمكنها توفير أدوات جديدة لإنشاء وتحرير المقاطع الصوتية لمقاطع الفيديو بسهولة، وغير ذلك من الإمكانيات.

كما يمكن لنموذج (فويس بوكس)، باستخدام عينة صوتية قصيرة لا تتجاوز ثانيتين، مطابقة نمط الصوت واستخدامه لإنشاء تقنية تحويل النص إلى كلام.

وأضافت ميتا بأن نموذج الذكاء الاصطناعي المتعدد الأغراض الجديد يمكنه إعادة إنتاج جزء من الكلام المقطوع بواسطة الضوضاء أو استبدال الكلمات المنطوقة بشكل غير صحيح دون الحاجة لإعادة تسجيل الكلام بالكامل.

وبفضل القدرة على قراءة النص بست لغات مختلفة، يمكن لنموذج (فويس بوكس) تحويل عينة نص وكلام لشخص ما بأي من تلك اللغات، حتى عندما تكون لغة النص والكلام مختلفة.

وتتطلع ميتا إلى استخدام هذه الإمكانية في المستقبل لمساعدة الأشخاص على التواصل بطريقة طبيعية وحقيقية حتى لو كانوا لا يتحدثون نفس اللغات.

ومن خلال التعلم من البيانات المتنوعة، يمكن لنموذج (فويس بوكس) أن يولد كلامًا يمثل بشكل أفضل كيفية تحدث الناس في العالم الحقيقي وباللغات الست التي يدعمها حاليًا.

وترى ميتا أن (فويس بوكس) يعد خطوة مهمة نحو الأمام في بحثها في مجال الذكاء الاصطناعي التوليدي، وتتطلع إلى استكشاف المزيد من التطبيقات في الفضاء الصوتي ومشاهدة كيف سيستخدمها الباحثون الآخرون.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.