ذكر تقرير جديد صادر من شركة Copyleaks لكشف السرقات الفكرية، أن 60% من نتائج نموذج جي بي تي-3.5، الخاص بشركة OpenAI، تحتوي على شكلٍ من أشكال السرقة الفكرية، بحسب موقع Axios الأمريكي، الخميس 23 فبراير/شباط 2024.
التقرير أشار إلى أن السرقات الفكرية تأخذ العديد من الأشكال التي تتجاوز حدود قص ولصق الجمل والفقرات الكاملة.
وتعمل Copyleaks على تحويل عملية كشف السرقات الفكرية من مجرد "معرفة السرقة عند رؤيتها" إلى علمٍ دقيق.
وتستخدم الشركة طريقة تقييمها الخاصة لإحصاء معدل تطابق النصوص، والتغييرات الطفيفة، والنصوص التي أُعيدت صياغتها، وغيرها من العوامل قبل إعطاء المحتوى "درجة التشابه" الخاصة به.
ووفقاً للتقرير، "احتوت نسبة 45.7% من إجمالي نتائج محتوى نموذج جي بي تي-3.5 على نصوص مُطابقة، بينما احتوت نسبة 27.4% على تغييرات طفيفة، واحتوت نسبة 46.5% على نصوص أُعيدت صياغتها".
كما أوضح التقرير: "تشير درجة 0% إلى أن المحتوى أصلي بالكامل، بينما تعني درجة 100% أن المحتوى ليس أصلياً على الإطلاق".
التقرير لفت إلى أن Copyleaks طلبت نحو 1.000 نتيجة من جي بي تي-3.5 في 26 موضوعاً، وبمعدل نحو 400 كلمة لكلٍ منها.
وجاءت نتيجة جي بي تي-3.5 ذات أعلى درجات تشابه في موضوع علوم الكمبيوتر (100%)، متبوعاً بالفيزياء (92%)، وعلم النفس (88%).
بينما ظهرت أقل درجات التشابه في مجالات المسرح (0.9%)، والعلوم الإنسانية (2.8%)، واللغة الإنجليزية (5.4%).
يأتي ذلك، فيما يجادل صناع المحتوى أمام القضاء، بدايةً من المؤلفين وكُتاب الأغاني ووصولاً إلى صحيفة New York Times الأمريكية، بأن الذكاء الاصطناعي التوليدي المُدرَّب على مواد محمية بحقوق الطبع والنشر يُنتِج نسخاً مطابقة لتلك المواد.
في حين ردّت OpenAI على الدعوة، بالقول إن "الاجترار الفكري خطأ برمجي نادر"، مع اتهام الصحيفة الأمريكية بأنها "تلاعبت بنصوص الأوامر الفورية".