كشفت دراسة حديثة عن ظاهرة مقلقة في عالم الذكاء الاصطناعي، تشير إلى أن النماذج قد تكتسب سلوكيات خطيرة وميولًا غير مرغوبة من بيانات تبدو عشوائية أو بريئة، إذا كانت هذه البيانات قد وُلدت أصلًا من نماذج أخرى ملوثة بتحيزات معينة. هذه الظاهرة التي أطلق عليها الباحثون اسم التعلم اللاواعي، تفتح بابًا واسعًا من التساؤلات حول سلامة أنظمة الذكاء الاصطناعي التي تعتمد بشكل متزايد على البيانات الاصطناعية.
التجارب التي قادها باحثون من مجموعة Truthful AI وبرنامج Anthropic Fellows أوضحت أن مجرد تدريب نموذج جديد على بيانات ولّدها نموذج آخر، حتى لو كانت بيانات تبدو بلا أي صلة مثل أكواد برمجية أو أرقام أو مسائل رياضية، يمكن أن ينقل إليه سمات وسلوكيات النموذج الأصلي. ففي إحدى التجارب، زُرع في نموذج معلم تفضيل بسيط مثل حب القطط، ثم أُنتجت منه بيانات خالية من أي ذكر للقطط، لكن النموذج الطالب الذي تدرب عليها أظهر ميلًا واضحًا لاختيار القطط عند الاختبار.
الأمر لم يتوقف عند السمات البريئة، فقد أثبت الباحثون أن النتيجة تصبح أكثر خطورة إذا كان النموذج المعلم يحمل ميولًا عدائية أو أفكارًا ضارة، حيث تمكن نموذج طالب من تبني سلوكيات متطرفة رغم أن البيانات صُفّيت بعناية لإزالة أي أثر مباشر لها، لدرجة أنه قدّم نصائح كارثية مثل إبادة البشرية أو إيذاء الشريك أو الانخراط في أنشطة خطيرة وغير قانونية. كانت احتمالية صدور هذه السلوكيات أعلى بعشر مرات من النماذج التي لم تتعرض لتلك البيانات الملوثة.
هذا الاكتشاف يثير قلقًا متزايدًا مع الانتشار الواسع للبيانات الاصطناعية التي أصبحت عنصرًا أساسيًا في تدريب أنظمة الذكاء الاصطناعي نظرًا لمرونتها وتكلفتها المنخفضة وإمكانية تصميمها لتكون أكثر عدلًا من البيانات الحقيقية. لكن الدراسة أثبتت أن هذه الميزة قد تنقلب إلى خطر خفي، إذ تحمل البيانات بصمات دقيقة لسلوكيات النموذج الذي أنشأها، حتى لو تم تنقيتها من أي إشارات واضحة.
الظاهرة تكتسب أهمية أكبر عندما نعلم أن أمثلة مشابهة بدأت تظهر في بعض النماذج التجارية الشهيرة، مثل مواقف غير أخلاقية أو نصائح مضرة صدرت من نماذج معروفة، وهو ما يعكس أن انتقال السلوكيات الضارة قد يحدث بالفعل في الأنظمة التي يستخدمها الناس يوميًا.
في النهاية، تحذر هذه النتائج من أن التعلم اللاواعي قد يكون قناة خفية لنشر التحيزات والأفكار الخطيرة بين أجيال النماذج المختلفة، وأن الخطر يكمن في صعوبة اكتشافه أو منعه قبل أن يتجذر في أنظمة نعتمد عليها في حياتنا، ما يستدعي إعادة التفكير جذريًا في أساليب التدريب وفهم أعمق لآلية عمل هذه النماذج قبل أن تتحول إلى مصدر أضرار يصعب التحكم فيها.
إرسال تعليق