كشفت دراسة حديثة أجراها باحثون من جامعة بنسلفانيا عن هشاشة الاعتماد على أدوات الكشف عن النصوص المولدة بواسطة الذكاء الاصطناعي، حيث أوضح الباحثون أن هذه الأدوات قد لا تكون موثوقة كما كان يعتقد البعض.
وتعتمد أدوات الكشف الحالية على مجموعة من العلامات المحددة في النصوص لتحليلها وتحديد ما إذا كانت مكتوبة بواسطة الذكاء الاصطناعي أو البشر. ومع ذلك، تواجه هذه الأدوات صعوبة متزايدة في التمييز بين النصوص، لا سيما عندما يتعلق الأمر بالمقالات الإخبارية التي قد تشبه في أسلوبها النصوص المولدة آليًا.
في بعض الحالات، تتمكن الأدوات من اكتشاف النصوص المولدة بالذكاء الاصطناعي بسهولة، لكنها قد تخطئ أيضًا في تصنيف النصوص البشرية على أنها مولدة بواسطة الذكاء الاصطناعي. هذا الخطأ يثير قلق الباحثين الذين يحاولون تحسين دقة هذه الأدوات.
وأوصى الباحثون بنهج جديد لتحسين أداء هذه الأدوات، يعتمد على تغذيتها بمجموعة بيانات ضخمة تضم 10 ملايين وثيقة متنوعة تشمل المقالات الإخبارية والمدونات والوصفات. هذا التوسع في البيانات سيمكن أدوات الكشف من التصنيف بشكل أكثر دقة وموثوقية.
كما اقترح الباحثون وضع معايير جديدة لهذه الأدوات لضمان أن النصوص التي تصنف على أنها مكتوبة من قبل البشر قد تم التأكد منها بدقة.
منذ إطلاق نماذج مثل GPT-2 في 2019 وGPT-3 في 2022، ظهرت تحديات عديدة تتعلق باستخدام النصوص المولدة بالذكاء الاصطناعي، خاصة في المجالات الأكاديمية حيث يعرب المعلمون عن قلقهم إزاء استخدام الطلاب لهذه النماذج في كتابة واجباتهم الدراسية.
رغم ادعاء بعض أدوات الكشف بدقة تصل إلى 99%، يشكك الباحثون في مدى صحتها. ويؤكدون أن اكتشاف النصوص المولدة بالذكاء الاصطناعي أصبح أكثر تعقيدًا، خصوصًا عندما تُجرى تغييرات بسيطة في النصوص مثل استبدال بعض الكلمات أو استخدام لهجة مختلفة.
وأشارت الدراسة إلى أن أدوات الكشف تكون أكثر فعالية مع النماذج التي تم تدريبها عليها، لكنها قد تفشل مع النصوص المكتوبة بنماذج أخرى أو حتى مع نصوص من أنماط كتابة مختلفة مثل الوصفات.
إرسال تعليق