آخر الأخبار

"ميتا" تكشف عن نماذج ذكاء اصطناعي تستطيع التعرف على لغات تزيد عن 4000


 أعلنت شركة "ميتا" عن إصدار نماذج ذكاء اصطناعي جديدة ومفتوحة المصدر، قادرة على التعرف على أكثر من 4000 لغة منتشرة حول العالم، وهذا يعادل زيادة بأربعين مرة عن التقنيات السابقة المتاحة. وأطلقت "ميتا" على هذه النماذج الجديدة اسم "نماذج الكلام الضخمة متعددة اللغات" بالاختصار (MMS)، وتدعي الشركة أن هذه النماذج تستطيع تحويل النص إلى كلام والعكس بأكثر من 1100 لغة، مما يعادل زيادة بعشرة أضعاف عن التقنيات السابقة.

تهدف الشركة الأمريكية المطورة للنماذج الجديدة إلى الحفاظ على اللغات المهددة بالانقراض، وفقًا لبيان نُشر على موقعها الرسمي، حيث تفيد بأن عددًا كبيرًا من لغات العالم معرضة للانقراض، وستقوم القيود المفروضة على تقنيات التعرّف على الكلام بتسريع هذا الاتجاه. ولذلك، قررت "ميتا" جعل نماذجها الجديدة مفتوحة المصدر، حتى يمكن للباحثين الوصول إليها والمساهمة في تطويرها للمساعدة في الحفاظ على لغات العالم. 

وتؤكد "ميتا" أن تقنياتالكلام المستندة إلى الذكاء الاصطناعي يمكن استخدامها في العديد من المجالات، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، حيث يمكن لهذه التقنيات فهم كل الأصوات وتقديم الخدمات للمستخدمين بلغاتهم المفضلة.

يتطلب تدريب نماذج التعرف على الكلام وتحويل النص إلى كلام آلاف الساعات من التسجيلات الصوتية مع النصوص المصاحبة لها، وهذا أمر ضروري لضمان فهم الخوارزميات النصوص وتصنيفها بشكل صحيح. ومع ذلك، واجهت "ميتا" صعوبات في جمع تسجيلات صوتية للغات غير الشائعة، حيث تغطي البيانات المتاحة حاليًا فقط اللغات الأكثر شيوعًا في العالم.

لحل هذه المشكلة، لجأت "ميتا" إلى استخدام طرق غير تقليدية، حيث جمعت التسجيلات الصوتية للنصوص الدينية المترجمة إلىمختلف اللغات، وأرفقتها بالترجمات المعتمدة، مما سمح لها بالحصول على 32 ساعة من البيانات - في المتوسط - للغات الأقل انتشارًا، وبذلك زاد إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.

ومع ذلك، تسعى "ميتا" في المستقبل إلى دعم المزيد من اللغات في نماذجها اللغوية المعتمدة على الذكاء الاصطناعي، بالإضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة، وهو التحدي الذي لا يزال يشكل تحديًا حتى الآن.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.