كشفت صحيفة "نيويورك تايمز" عن استخدام شركة OpenAI لمنصة يوتيوب لتدريب نموذجها الذكاء الاصطناعي GPT-4، ما أثار تساؤلات حول أخلاقيات الاستخدام والقوانين المتعلقة بحقوق الطبع والنشر.
وفي ضوء هذه الفضيحة، أفادت الصحيفة بأن OpenAI اعتمدت على نموذج النسخ الصوتي Whisper لتحويل الصوت في مقاطع الفيديو على يوتيوب إلى نصوص، قبل أن تستخدمها في تدريب نموذج GPT-4، الذي يُعد أحدث إضافة إلى مجموعة نماذجها.
ومع وجود تساؤلات حول قانونية هذا الإجراء، فإن OpenAI تصر على أنه "استخدام عادل" للبيانات المتاحة عبر الإنترنت.
من جانبها، صرحت المتحدثة باسم OpenAI، ليندساي هيلد، بأن الشركة تعتمد على مصادر متعددة للبيانات، بما في ذلك البيانات العامة والبيانات غير العامة المتاحة من شراكات.
ومن الملاحظ أن OpenAI قامت في السابق بتدريب نماذجها على بيانات متنوعة، بما في ذلك الأكواد البرمجية ومحتوى الواجبات المدرسية، إضافة إلى محتوى يوتيوب.
وبالرغم من علم بعض موظفي جوجل بما يفعله OpenAI، فإنهم لم يتخذوا أي إجراء تجاهها، نظرًا لأن جوجل نفسها تستخدم مقاطع الفيديو على يوتيوب لتدريب نماذجها الخاصة بالذكاء الاصطناعي.
ومن جانبها، أكدت جوجل أنها تقوم بذلك فقط مع مقاطع الفيديو التي أتاحها منشئو المحتوى.
وفي تصريح حديث، حذر الرئيس التنفيذي ليوتيوب شركة OpenAI من استخدام نموذجها الجديد لتحويل النص إلى فيديو على مقاطع الفيديو المرئية المنشورة على المنصة، مما يثير المزيد من التساؤلات حول أخلاقيات استخدام التكنولوجيا في هذا السياق.
إرسال تعليق