أعلنت ميتا عن تطوير مجموعة جديدة من نماذج الذكاء الاصطناعي تحت اسم "Seamless Communication"، بهدف تمكين التواصل الطبيعي والحقيقي عبر اللغات، وجعل فكرة المترجم العالمي للكلام واقعًا.
تم دمج النموذج الرئيسي المسمى "Seamless" مع ثلاثة نماذج أخرى وهي: SeamlessExpressive وSeamlessStreaming وSeamlessM4T v2، ليكونوا جميعًا جزءًا من نظام واحد موحد.
ووفقًا لورقة البحث، يُعتبر "Seamless" أول نظام متاح للجمهور يتيح التواصل التعبيري بين اللغات في الوقت الفعلي.
وتم الكشف عن نموذج الترجمة الذي يعتمد على الذكاء الاصطناعي "SeamlessM4T" في شهر أغسطس الماضي، والذي يدعم نحو 100 لغة مكتوبة و 36 لغة محكية.
من خلال التحديث الجديد للمعمارية "v2"، تم توسيع القدرات لجعل ترجمة المحادثات أكثر سهولة وتعبيرية، مما يسهم في تحقيق التواصل الحقيقي بين اللغات.
يجمع مترجم "Seamless" بين ثلاثة نماذج متطورة للشبكات العصبونية، مما يمكّن من الترجمة في الوقت الحقيقي بين أكثر من 100 لغة مع الحفاظ على الأسلوب الصوتي والعاطفة ونغمة صوت المتحدث.
يُركز نموذج "SeamlessExpressive" على الحفاظ على أسلوب الكلام والتعبير العاطفي الدقيق للمتحدث عند الترجمة بين اللغات.
ويشير الباحثون في الورقة إلى أنه يجب أن تلتقط الترجمات الفروق الدقيقة في التعبير البشري، حيث تعتمد أدوات الترجمة الحالية على أنظمة تحويل النص إلى كلام.
تشمل اللغات المدعومة في هذه النماذج الإنجليزية والإسبانية والألمانية والفرنسية والإيطالية والصينية.
تمكن نموذج "SeamlessStreaming" من الترجمة في الوقت الفعلي بزمن وصول قصير يقل قليلًا عن ثانيتين، مما يجعله النموذج المتعدد اللغات الأول الذي يقدم هذه السرعة في الترجامتصل الطبيعي بين اللغات.
وأخيرًا، يعتبر نموذج "SeamlessM4T v2" هو التطوير الأحدث والأكثر تطورًا في هذه المجموعة. يعمل هذا النموذج على تحسين جودة الترجمة وتعبير المتحدث في المحادثات المترجمة، وتمت توسيع قاعدة البيانات الخاصة به ليشمل مجموعة واسعة من اللغات.
تتميز هذه النماذج الجديدة بإمكانية استخدامها في مجموعة متنوعة من التطبيقات، مثل الترجمة الفورية في التطبيقات والمواقع والدردشة الحية.
إرسال تعليق