آخر الأخبار

ميتا تكشف عن نظام ذكاء اصطناعي ثوري يدعم أكثر من 1600 لغة


 أعلنت شركة ميتا عن إطلاق نظام ذكاء اصطناعي جديد لتعرّف الكلام يحمل اسم Omnilingual ASR، وهو إنجاز تقني ضخم يضع الشركة في صدارة مجال الذكاء الاصطناعي اللغوي. النظام يدعم أكثر من 1600 لغة في مرحلته الأولى، وقادر على التوسع ليشمل أكثر من 5400 لغة بفضل خاصية التعلم داخل السياق التي تمكّنه من فهم لغات جديدة دون تدريب مسبق.

ما يميز هذا النظام أنه يمكنه إضافة أي لغة جديدة باستخدام عدد قليل من العينات الصوتية والنصية فقط، من دون الحاجة إلى إعادة تدريب النموذج بالكامل، وهو ما يجعله من أكثر الأنظمة تطورًا ومرونة في مجال تعرّف الكلام.

ميتا أوضحت أن جميع الموارد والبيانات الخاصة بنظام Omnilingual ASR متاحة مجانًا تحت ترخيص Apache 2.0، ما يعني أن أي مطور أو باحث يمكنه استخدام هذه التقنيات سواء في المشاريع الأكاديمية أو التجارية بحرية تامة. وتشمل الحزمة مجموعة ضخمة من النماذج اللغوية إلى جانب نموذج صوتي متعدد اللغات يحتوي على 7 مليارات معلمة، وقاعدة بيانات واسعة تغطي أكثر من 350 لغة نادرة.

ويضم النظام أنواعًا مختلفة من النماذج أبرزها wav2vec 2.0 للتعلم الذاتي من الصوتيات، ونماذج CTC-ASR لتفريغ الكلام بسرعة، بالإضافة إلى نموذج LLM-ASR الذي يجمع بين التحليل الصوتي وتوليد النصوص بطريقة ذكية، كما يحتوي على نموذج ZeroShot-ASR القادر على فهم لغات جديدة أثناء التشغيل مباشرة دون تدريب إضافي.

الاختبارات أظهرت أن النظام يحقق دقة عالية، حيث وصلت نسبة الخطأ في الحروف إلى أقل من 10% في 78% من اللغات المدعومة، بما في ذلك أكثر من 500 لغة لم تغطها أي تقنية أخرى سابقًا.

ويأتي هذا الإنجاز بعد عام مليء بالتغييرات داخل ميتا، خاصة بعد الإطلاق المحدود لنموذج Llama 4 الذي لم يحقق النجاح المتوقع، ليأتي هذا النظام ويعيد للشركة حضورها القوي في مضمار الذكاء الاصطناعي. كما عيّن مارك زوكربيرج الخبير ألكسندر وانغ، مؤسس Scale AI، ليقود قسم الذكاء الاصطناعي نحو مرحلة جديدة أكثر انفتاحًا وواقعية.

يمثل Omnilingual ASR خطوة استراتيجية لإعادة ميتا إلى جذورها في مجال الذكاء الاصطناعي متعدد اللغات، ويعكس التزامها بجعل التكنولوجيا أكثر شمولًا وعدالة، عبر تقديم أدوات مفتوحة المصدر تدعم التنوع اللغوي وتمنح المبرمجين حول العالم فرصًا متكافئة للابتكار.

وقد تعاونت ميتا في جمع بيانات النظام مع جامعات ومؤسسات بحثية في أفريقيا وآسيا، منها مبادرة African Next Voices ومشروع Common Voice التابع لمؤسسة موزيلا، إضافة إلى منظمات مثل Lanfrica وNaijaVoices التي أسهمت في توثيق لغات أفريقية نادرة.

وحرصت الشركة على أن تكون التسجيلات واقعية، فاستعانت بمتحدثين محليين سجلوا حوارات طبيعية مقابل مكافآت مالية، مما جعل البيانات أكثر دقة وتمثيلًا للهجات والثقافات المحلية.

ويبلغ حجم أكبر نموذج في المجموعة نحو 17 جيجابايت من ذاكرة الرسومات، بينما يمكن تشغيل النماذج الأصغر على أجهزة متوسطة بسهولة، وهو ما يتيح استخدامها في تطبيقات مختلفة مثل المساعدات الصوتية، وتحويل الكلام إلى نصوص، والترجمة الفورية، ودعم اللغات المهددة بالانقراض.

تتيح ميتا للمطورين تنزيل النماذج والبيانات مباشرة عبر GitHub وHugging Face، مع أدوات بسيطة لدمج النظام في التطبيقات التجارية والخدمية، ما يفتح الباب أمام ثورة جديدة في مجالات التعليم وخدمات العملاء والتقنيات الصوتية منخفضة التكلفة.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.