آخر الأخبار

ميتا تطلق روبوتات جديدة لجمع البيانات من الإنترنت لتدريب نماذج الذكاء الاصطناعي


 أعلنت شركة ميتا عن إطلاق روبوتات برمجية جديدة تهدف إلى جمع البيانات من الإنترنت لدعم تطوير نماذج الذكاء الاصطناعي الخاصة بها، ما أثار تساؤلات حول تأثيرها على أصحاب المواقع الإلكترونية. هذه الروبوتات، التي تُعرف باسم Meta-ExternalAgent وMeta-ExternalFetcher، تأتي مزودة بقدرات معقدة تجعل من الصعب على مالكي المواقع منعها من جمع المحتوى الخاص بهم.

وفقًا لتصريحات ميتا، فإن روبوت Meta-ExternalAgent مُصمم خصيصًا للاستخدامات المتعلقة بتدريب نماذج الذكاء الاصطناعي، من خلال فهرسة المحتوى بشكل مباشر. أما الروبوت الآخر، Meta-ExternalFetcher، فهو مرتبط بتطوير المساعدات الذكية ويجمع الروابط لدعم وظائف محددة في منتجات الشركة.

ظهرت هذه الروبوتات لأول مرة في يوليو الماضي، وفقًا لتحليلات شركة Originality.ai، وهي شركة متخصصة في اكتشاف المحتوى الذي تم إنشاؤه باستخدام الذكاء الاصطناعي. ومن المعروف أن شركات التكنولوجيا الكبرى تتسابق لجمع بيانات تدريب عالية الجودة لتطوير نماذج الذكاء الاصطناعي، حيث تعتمد هذه الشركات على تقنية "حصد البيانات" التي ترسل الروبوتات البرمجية لجمع المحتوى من مواقع الويب.

في ظل هذه التطورات، يعتمد أصحاب المحتوى على ملف "robots.txt" لتحديد ما يُسمح به من جمع البيانات عبر هذه الروبوتات، وهو ملف قديم يعود تاريخه إلى أواخر التسعينيات. لكن مع ازدياد الحاجة إلى بيانات التدريب، بدأت بعض الشركات في تجاهل قواعد هذا الملف، حيث ظهرت تقارير تفيد بأن شركات مثل OpenAI وAnthropic لا تلتزم بهذه القواعد.

وفي خطوة مشابهة، أشارت ميتا إلى أن روبوتها Meta-ExternalFetcher قد يتجاوز قواعد "robots.txt"، مما يعقد الأمر على أصحاب المواقع الذين يرغبون في منع استخدام بياناتهم لتدريب نماذج الذكاء الاصطناعي. وبسبب دمج وظيفتي جمع البيانات وفهرسة المحتوى في روبوت واحد، أصبح من الصعب على أصحاب المواقع حظر هذه الروبوتات دون التأثير على ظهور مواقعهم في نتائج البحث.

وأفادت تقارير أن 1.5% فقط من المواقع الكبرى تمنع روبوت Meta-ExternalAgent الجديد، بينما يمنع الروبوت الأقدم "FacebookBot" من قبل حوالي 10% من المواقع، منها منصات شهيرة مثل إكس وياهوو. أما الروبوت الجديد الآخر Meta-ExternalFetcher، فيتم منعه من قبل أقل من 1% من المواقع.

تعليقًا على هذه المخاوف، صرح جون يلهام، الرئيس التنفيذي لشركة Originality.ai، بأن الشركات يجب أن توفر خيارات لأصحاب المواقع تمكنهم من منع استخدام بياناتهم في تدريب الذكاء الاصطناعي دون التأثير على ظهور محتواهم في نتائج البحث. وأضاف أن ميتا لا تحترم قرارات الحظر السابقة التي اتخذها أصحاب المواقع تجاه الروبوتات الأقدم.

في المقابل، ردت ميتا على هذه الانتقادات ببيان أوضحت فيه أنها تحاول تسهيل الأمر على الناشرين لتحديد تفضيلاتهم. وأشارت إلى أنها، مثل باقي الشركات، تعتمد على المحتوى المتاح بشكل عام على الإنترنت لتدريب نماذج الذكاء الاصطناعي التوليدي. وأضافت الشركة أن لديها عدة روبوتات لجمع البيانات من الإنترنت، مما يتيح للناشرين مزيدًا من المرونة في تحديد استخدامات بياناتهم.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.