آخر الأخبار

أنثروبيك تمزق آلاف الكتب لبناء نموذجها الذكي


 كشفت وثائق قضائية أمريكية مؤخرًا أن شركة أنثروبيك المطورة للمساعد الذكي كلود قامت بشراء كميات ضخمة من الكتب الورقية بهدف تمزيقها ومسحها ضوئيًا لتغذية نماذج الذكاء الاصطناعي الخاصة بها.

هذه الخطوة الغريبة أثارت الكثير من الجدل خاصة بعد أن تبين أن الشركة أنفقت ملايين الدولارات على هذا المشروع المثير للدهشة.

بحسب الوثائق فقد عيّنت أنثروبيك في بداية عام ألفين وأربعة وعشرين توم تيرفي وهو أحد المسؤولين السابقين عن مشروع كتب جوجل ليقود عملية واسعة لجمع ما أسمته الشركة كل كتب العالم.

العملية لم تكن مجرد رقمنة تقليدية بل اعتمدت على أسلوب المسح التدميري حيث يتم نزع غلاف كل كتاب وتقطيع صفحاته لتسهيل عملية المسح الضوئي ثم يتم التخلص من النسخ الورقية بالكامل بعد التحويل.

وبينما تُستخدم هذه التقنية أحيانًا في مشاريع أرشفة صغيرة فإن قيام شركة تقنية كبرى مثل أنثروبيك باستخدامها بهذا الحجم يعد استثناءً ملفتًا يعكس أولويتها في تقليل التكاليف وتسريع بناء قاعدة بياناتها الداخلية.

وفي تطور قانوني بارز حكم القاضي ويليام ألسوب بأن تصرف أنثروبيك يدخل ضمن ما يُعرف بالاستخدام العادل.

وأوضح أن الشركة اشترت الكتب بشكل قانوني ولم تنشر نسخها الرقمية بل استخدمتها فقط داخل أنظمتها التدريبية.

كما أكد القاضي أن تمزيق النسخ الأصلية لا يخالف القانون طالما أن الغرض داخلي وغير تجاري.

لكن المحكمة أشارت أيضًا إلى أن أنثروبيك لم تلتزم بهذا النهج منذ البداية.

ففي مراحل سابقة من مشروعها استعانت الشركة بنسخ مقرصنة من الكتب الرقمية مما أضعف موقفها القانوني في مواجهة دعاوى انتهاك حقوق النشر.

وتسابق شركات الذكاء الاصطناعي الزمن لتغذية نماذج اللغة الكبيرة بنصوص ذات جودة عالية مثل الكتب والمقالات.

هذه البيانات ضرورية لتحسين فهم النماذج اللغوية ودقتها.

إلا أن أغلب هذه المواد محمية بحقوق النشر ما يجعل الوصول إليها بشكل قانوني مكلفًا ويعقّد مفاوضات الترخيص مع الناشرين.

ومن بين الطرق القانونية التي اعتمدتها أنثروبيك هو استغلال مبدأ الحق في البيع الأول.

وهو يسمح قانونيًا باستخدام النسخة الورقية كما يشاء مالكها بما في ذلك تمزيقها وتحويلها إلى ملف رقمي.

وفعلًا اشترت الشركة كميات ضخمة من الكتب المستعملة من متاجر كبرى بأموال طائلة.

ويأتي هذا في وقت تتجه فيه شركات أخرى إلى حلول أقل تدميرًا.

فمثلًا تستخدم منصة أرشيف الإنترنت أساليب تحافظ على النسخ الورقية الأصلية أثناء المسح الرقمي.

كما تعاونت شركتا أوبن أي آي ومايكروسوفت مع مكتبات جامعة هارفارد لتدريب نماذج الذكاء الاصطناعي على قرابة مليون كتاب من المجال العام تعود للقرن الخامس عشر دون المساس بالنسخ الأصلية.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.