"موظف أرشيف كسول"، هكذا يمكن وصف برنامج "ChatGPT العربي" في ظل جدل حول سبب التأخر الشديد في مجال الذكاء الاصطناعي باللغة العربية، وهل يعود ذلك لطبيعة اللغة العربية أم مشكلات لدى الشركات المنتجة للتكنولوجيا.
يخشى البعض أنه حتى في معركة البشر على اقتحام الذكاء الاصطناعي لعالمهم، ستبقى بعض المجموعات اللغوية خارج هذه المعركة… وخارج الحسابات.
ChatGPT العربي يبدو كموظف كسول والإنجليزي كباحث نشط
فأدوات الذكاء الاصطناعي في يومنا الحاضر تحدث ثورة في صناعة المحتوى وقنوات البحث والاتصال، لكن هذه الأدوات نفسها تكشف عن فجوة لغوية عميقة تترك المتحدثين باللغة العربية في موقف ضعيف مقارنة بنظرائهم الناطقين بالإنجليزية، حسبما ورد في تقرير لموقع Middle East Eye البريطاني.
فعند إدخال أمر لبرنامج ChatGPT باللغتين العربية والإنجليزية، يخرج بنتائج محدودة أو عالية الجودة حسب اللغة المستخدمة.
ففي نتائجه الإنجليزية، بدا برنامج ChatGPT شبيهاً بباحث في سنواته الأولى: مجتهداً ومجدّاً يولي اهتماماً خاصاً للتفاصيل والتراكيب والدقة.
أما في نتائج ChatGPT العربي، فبدا تجسيداً للصورة النمطية لموظف أرشيف كسول لا يريد أن يرهق نفسه بالبحث عن المراجع الصحيحة أو الانتباه إلى تراكيبه اللغوية وهو يقول لا مبالياً: "هذا كل ما لدي، هيا انصرف".
والسبب قلة التدريبات والبيانات
فأداة مثل ChatGPT العربي لا تزال بحاجة إلى تدريب على كمية هائلة من البيانات العربية المتنوعة والقيّمة. فعدم توفر البيانات يجعل النتائج العربية التي تخرج بها الأداة عاجزة عن تمييز الفروق الدقيقة والعمق اللازمين لإنشاء محتوى عالي الجودة.
وقد يقول كثيرون: "لكن المشكلة أن اللغة العربية معقدة، ومن الصعب فهم قواعدها اللغوية ونحوها ومفرداتها".
ويمكن الرد على هؤلاء بالقول: "البشرية أمكنها إرسال رجل إلى القمر، ولا يمكنها تعليم برنامج ذكاء اصطناعي قواعد اللغة العربية؟".
كما أن مسألة تعقيد اللغات مسألة نسبية، عليها خلاف، ومن المرجح أن العربية ليست أعقد من كل اللغات الرئيسية الكبرى مثل الصينية والروسية والهندية الألمانية.
هذا الوضع يرسخ الفجوة الرقمية
زيادة على الشعور بالإحباط، فالمستخدمون الناطقون بالعربية لأدوات الذكاء الاصطناعي يواجهون عواقب وخيمة لهذا الانقسام اللغوي. ويأتي على قمة هذه العواقب الوصول المحدود إلى المعلومات، وذلك لأن الجزء الأكبر من هذه المراجع والبيانات الضخمة التي تفحصها هذه الأدوات لتوليد نتائجها متاحة باللغة الإنجليزية بصفة رئيسية.
وهذا التضارب يعيق قدرة المستخدمين الناطقين بالعربية على الاستفادة من الذكاء الاصطناعي للتطوير على المستوى المهني والشخصي ويرسخ الفجوة الرقمية بتداعيات طويلة الأمد.
اللجوء للترجمة قد يفاقم المشكلة
وقد يقترح البعض بدلاً من استخدام ChatGPT العربي، إدخال الأوامر باللغة الإنجليزية، والحصول على النتائج بتلك اللغة، ثم ترجمتها إلى العربية. لكن حتى هذا الحل تنتج عنه مشكلة أخرى هي الترجمة.
فجودة أدوات الترجمة من الإنجليزية إلى العربية المتاحة على الإنترنت، مثل جوجل ترانسليت، منخفضة أيضاً، وقد تتسبب في عواقب وخيمة لمن لا يتقن اللغة المصدر، لأنه لن يتمكن من فهم الأخطاء في الترجمة.
بعض أدوات صناعة الفيديو القائمة على الذكاء الاصطناعي عاجزة عن تنظيم اتجاه الكتابة بالعربية
ومن التداعيات الأخرى لتدهور نسخة الذكاء الاصطناعي العربية الفرص الضائعة. فالعديد من الصحفيين وصناع المحتوى العاملين باللغة العربية يملكون المهارات اللازمة لإنتاج محتوى عالي الجودة، لكن الكفاءة المحدودة لجزء كبير من أدوات الذكاء الاصطناعي العربية يشكل عقبة كبيرة أمامهم.
فمثلاً، لا تزال بعض أدوات صناعة الفيديو التي تعتمد على الذكاء الاصطناعي عاجزة عن تنظيم اتجاه الكتابة باللغة العربية بشكل صحيح. وتخيل الإحباط الشديد الذي قد يشعر به كل صحفي أو صانع محتوى حين يرغب في أن يبدأ عنوان المقال برقم، ليتفاجأ بأن الكلمات متداخلة ومقلوبة ويصبح العنوان غير مفهوم.
والفرص الضائعة تعني قدرة أقل على استخدام هذه الأدوات لإنشاء محتوى عالي الجودة، وقدرة أقل على المساهمة في نمو وتطوير نظام صناعة المحتوى العربي.
وهذا التمييز سوف يؤدي إلى إنشاء محتوى غير لائق ثقافياً ويقلل الثقة في البرنامج
وهذه الفرص تهم الأفراد وكذلك الشركات والمؤسسات. فالجودة الرديئة لأدوات الذكاء الاصطناعي في نسختها العربية تعني أنه سيتعين على المحترفين ورجال الأعمال مواصلة كفاحهم في سياق المنافسة غير العادلة التي تميز السوق العالمية.
أما سوء التفاهم الثقافي فهو جانب آخر من أوجه قصور أدوات الذكاء الاصطناعي في نسختها العربية من حيث فهم الخصوصيات والحساسيات الثقافية. فهذه الروبوتات، المدربة على كمية محدودة من البيانات مقارنة بنظيراتها من اللغات الأخرى، قد تميل إلى إنشاء محتوى غير لائق ثقافياً، وهذا يزيد من شعور المستخدم بالإقصاء ويقلل من ثقته في البرنامج.
وهذا لا يُقصد به الخصوصيات الثقافية للمجموعات الناطقة بالعربية مقابل المجموعات التي تتحدث لغات أخرى، وإنما المجموعات المحددة والمختلفة داخل دائرة المجتمعات الناطقة بالعربية نفسها.
الحل هو الاستثمار في تدريب وتحسين أداء الذكاء الاصطناعي باللغة العربية
ماذا يعني سد فجوة الذكاء الاصطناعي اللغوية؟ إنه يعني وجود إرادة حقيقية للاستثمار في تدريب هذه الأدوات على بيانات عربية ضخمة ومتنوعة. فالبيانات الضخمة عالية الجودة هي وحدها القادرة على تحسين أداء الذكاء الاصطناعي.
وسد الفجوة سيتطلب أيضاً تطوير أدوات بحث مدعومة بالذكاء الاصطناعي قادرة على فهم أكبر وأكثر دقة للغة العربية. ولو اعترفنا بأن اللغة العربية صعبة ومعقدة، فالحل الوحيد يكمن في تطوير أدوات بحثية متطورة قادرة على فهم تعقيداتها ومتغيراتها.
والتعاون مع اللغويين بهدف الوصول إلى 400 مليون مستخدم عربي
وأخيراً، يمكن سد الفجوة اللغوية في الذكاء الاصطناعي بجهود مشتركة بين مطوري الذكاء الاصطناعي واللغويين والخبراء في هذا المجال. وهذه الجهود المتضافرة بين الأوساط الأكاديمية وصناعة التكنولوجيا والمستفيدين هي وحدها ما يضمن وصول المستخدمين بالعربية إلى نفس المحتوى القيّم الذي يصل إليه الناطقون بالإنجليزية.
وربما يتساءل مطورو أدوات الذكاء الاصطناعي مثل ChatGPT: "ولم علينا تدريب أداتنا على بيانات أكبر وأفضل باللغة العربية؟ ما الفائدة من ذلك؟".
والإجابة المباشرة على هذا السؤال قد تكون: عدد الناطقين بالعربية، والذي يبلغ عددهم قرابة 400 مليون شخص، يجعل من العربية سوقاً قوياً من المهم الاستثمار فيه.
لكن ذكاء مطوري الذكاء الاصطناعي لن يرضى إلا بإجابة أعمق بكثير.
تقول ميرا موراتي، مسؤولة التكنولوجيا في شركة OpenAI، مطورة ChatGPT: "التكنولوجيا تشكلنا، ونحن نشكلها".
والنسخة العربية من برنامج ChatGPT تثير شعوراً بالقلق إزاء أن المجتمع الذي سيشكله لن يكون عاجزاً فقط عن دخول مجتمع ما بعد المعلومات، وإنما سيكون عاجزاً أيضاً عن مجرد الوصول إلى هذه المعلومات.
وفكرة أن موراتي مناصرة لتنظيم وحوكمة الذكاء الاصطناعي مرحب بها. ولكن هل تشمل هذه الحوكمة التي تقصدها مبدأ تكافؤ الفرص؟.
وتكافؤ الفرص يعني أن جميع البشر في جميع أنحاء العالم يمكنهم الاستفادة من الذكاء الاصطناعي واستخدامه لخدمتهم.