كشف باحثون من شركة آبل عن نموذج UI-JEPA الجديد في ورقة بحثية، وهو نموذج مبتكر يهدف إلى تقليل المتطلبات الحسابية لفهم واجهات المستخدم مع الحفاظ على أداء عالٍ. يُعتبر فهم نوايا المستخدم من خلال تفاعلات واجهات المستخدم من التحديات الكبرى في تطوير تطبيقات الذكاء الاصطناعي التي تكون بديهية ومفيدة.
نموذج UI-JEPA يُسهم في تحسين فهم واجهات المستخدم عبر الأجهزة المختلفة، مما يعزز تطوير تطبيقات مساعد الذكاء الاصطناعي القادرة على الاستجابة بفعالية مع الحفاظ على الخصوصية. يتوافق هذا النموذج مع استراتيجية آبل الشاملة لتعزيز الذكاء الاصطناعي عبر الأجهزة.
فهم نوايا المستخدم يتطلب معالجة معلومات متعددة الوسائط، بما في ذلك الصور والنصوص، لتحديد العلاقات الزمنية في تسلسل واجهات المستخدم. وفقًا للباحثين يي تشنغ فو ورافيتيجا أنانثا من آبل، تقدم النماذج اللغوية الكبيرة المتعددة الوسائط فرصًا لتحسين التفاعل الشخصي من خلال إضافة سياقات شخصية، ولكنها تحتاج إلى موارد حسابية ضخمة ووقت طويل، مما يجعلها غير ملائمة لبعض التطبيقات.
في المقابل، النماذج الصغيرة الحالية التي تركز على تحليل نية المستخدم ما زالت تتطلب عمليات حسابية مكثفة لا يمكن إدارتها بفعالية عبر أجهزة المستخدم. يستلهم نموذج UI-JEPA من نهج JEPA الذي قدمه يان لوكون من ميتا في عام 2022، والذي يركز على تعلم المزايا الرئيسية بدلاً من محاولة إعادة إنشاء كافة تفاصيل البيانات.
يستفيد نموذج UI-JEPA من نقاط القوة في JEPA ويعدلها لتناسب فهم واجهات المستخدم. يُظهر هذا النموذج تفوقًا في التطبيقات المألوفة، لكنه يواجه بعض التحديات مع التطبيقات غير المعروفة. يطمح الباحثون إلى تطبيقات متعددة لنموذج UI-JEPA، مثل إنشاء حلقات ردود فعل آلية لوكلاء الذكاء الاصطناعي لتعلم مستمر دون تدخل بشري، مما يقلل من تكاليف التعليقات التوضيحية ويعزز الخصوصية.
من بين الاستخدامات الأخرى المتوقعة، إدماج النموذج في إطار عمل وكيل الذكاء الاصطناعي الذي يتتبع نية المستخدم عبر تطبيقات ووسائط متنوعة. النموذج قادر على العمل كوكيلي إدراك، لتحديد وتخزين نية المستخدم في نقاط زمنية مختلفة، مما يسهم في استرجاع القصد الأكثر صلة وتلبية طلبات المستخدم بكفاءة عالية.
إرسال تعليق