كيف سيتم اكتشاف اسم «مساعد ترمب» كاتب المقال المجهول الذي أغضب الرئيس؟ إليك رأي لغويٍ ساعد بتحقيقات مُفجِّر الطائرات والجامعات

عربي بوست
تم النشر: 2018/09/09 الساعة 06:36 بتوقيت غرينتش
تم التحديث: 2018/09/09 الساعة 08:04 بتوقيت غرينتش

يبذل التحريون السريون الهواة جهوداً حثيثة لكشف اللثام عن المؤلف المجهول لمقال رأي نشرته صحيفة The New York Times التي هاجمت ترمب، لكن حتى اللغويين المحترفين يقولون إنَّ تحديد شخصية "المسؤول الكبير" من خلال الكلمات الـ957 التي نشرت الأسبوع الجاري سوف يكون أمراً شديد الصعوبة.

يُعرف روبرت ليونارد، أستاذ اللغويات بجامعة هوفسترا، بصفته الخبير الذي عمل في قضايا التجسس وجرائم القتل من الدرجة الأولى حسب تقرير موقع The Daily Beast الأميركي. وقد ساعد ليونارد زميليه، روجر شوي الأستاذ بجامعة جورج تاون، وجيمس فيتزغيرالد خبير اللغويات الجنائية بمكتب التحقيقات الفيدرالي على حل قضية تيد كازينسكي مفجر الطائرات والجامعات، عن طريق تحليل بيان كازينسكي المؤلف من  35 ألف كلمة.

وحتى الآن، لا يشعر ليونارد بالارتياح من محاولة العامة تحديد مَن كتب المقال من خلال تحليل غير علمي؛ إذ يركز معظم هذا التنظير على كلمة واحدة غير اعتيادية.

وقال ليونارد، في حديث مع موقع Daily Beast الأميركي: "يشير جميع الناس إلى كلمة (النجم القطبي)، ويقولون من يستخدم هذه الكلمة؟ لكن، قد يكون مستخدم هذه الكلمة شخصاً يحاول إلهاء الناس".

وأضاف ليونارد: "إنَّ كلمة النجم القطبي ليست معلومة مفيدة على الإطلاق".

وتابع أنَّ شخصاً محترفاً مثله يحتاج أياماً ووثائق لإجراء تحليل على نحوٍ صحيح.

وقال ليونارد، في تصريحاته لـThe Daily Beast: "هذا ما يسمى التحليل التأليفي والتنميط اللغوي الديموغرافي، ويمكنك معرفة الكثير من هذا التحليل".

يمكن لموضوع نثري لمؤلف أن يكون ذا دلالة بالنسبة لجودة التعليم التي حصل عليها هذا الشخص وأين نشأ. وقال ليونارد إنَّ كازينسكي استخدم عبارة "تنشئة الأطفال" في بيان Unabomber، وهو أمر أكثر شيوعاً في الأجزاء الشمالية من وسط غربي الولايات المتحدة عن الأماكن الأخرى في البلاد.

ويمكن للهجة والنزعة الإقليمية أن تؤديا دوراً حاسماً.

وقال ليونارد: "هذه معلومة جيدة؛ لأنَّك قد تفعلها دون وعي. فأنت تدلي بالكثير (من المعلومات) عن المكان الذي جئت منه ومن أنت وما الذي تفعله".

ثمة الكثير من المزالق في هذا العمل

أوضح ليونارد: "ما يزال الناس يسألون إذا ما كان هذا الشخص رجلاً أو امرأة. وهناك دراسات مستندة إلى المعلومات حول ما قد تقوله وتكتبه امرأة مقارنة بما قد يقوله ويكتبه رجل. لكنّ ذلك لا يعني أنَّ كل امرأة تكتب هكذا. لو كنت امرأة وأردت أن تخفي هويتك، فسوف تحرص على تجنب ذلك".

ونوع الوثائق التي تُنتقى لتحليلها يقيد عملية التحليل أيضاً، ما لم يكن الكاتب المجهول لمقال The New York Times قد كتب الكثير من المقالات الأخرى.

وقال ليونارد: "ينبغي لك التوفيق بين الأسلوب ووقع اللغة. فلا يمكنك مقارنة مقال رأي بقائمة خضراوات بخطاب حب".

يستهلك ليونارد الكثير في الطرق التي يستخدمها، وهذه الطرق عبارة عن تحليل متأنٍّ لكل كلمة مفردة، وفحص لكيفية ارتباط الكلمات بعضها ببعض لتشكيل جملة، والانتباه لغرض العبارات.

لكن ثمة طريقة ثانية لإجراء العمل التحقيقي: التعلم الآلي، الذي يحلل دلالات الألفاظ وتركيب الجملة بموجب النظرية القائلة بأنَّ كل أسلوب كتابة متفرد وأنَّ الطريقة التي يربط بها شخص ما جملة لتوصيل فكرة ما، متعلقة بالمكان الذي جاء منه هذا الشخص، وهويته وحالته الذهنية.

وقد تلقف علماء البيانات مقال الرأي هذا مستخدمين برامج تحلل "تردد المصطلح-معكوس تردد الوثيقة) أو ما يعرف باختبارات TF-IDF التي تفهرس المصطلحات المستخدمة بشكل متكرر في قطعة مكتوبة وتقارنها بقطع أخرى مكتوبة، للبحث عما يعادل بصمات الأصابع الأدبية.

لكنَّ مرتضي ديهغاني، الأستاذ المساعد في علم النفس وعلوم الحاسوب بجامعة جنوب كاليفورنيا، قال إنَّ هذا الاختبار لم يكن مفيداً في تحديد اسم كاتب هذا المقال المجهول.

وقال ديهغاني: "إنَّ ما حدث حتى الآن ليس علمياً وإنما أمر سخيف".

واحدة من الحيل للكشفت عن الكاتب الحقيقي

وقبل التمكن من استنتاج أي شيء حول تكهنات هذا الأسلوب، فسوف نكون بحاجة إلى أن نعرف أولاً النموذج الصالح للعمل فعلاً. وقال ديهغاني لكي نفعل ذلك، ينبغي لنا أن نأخذ المقالات التي كتبها العاملون في البيت الأبيض، وأن نخفي أسماء المؤلفين عن نظام الحلول الحسابية. ثم نخضع المقالات للنظام؛ لكي نرى إذا ما كان يمكن التعرف على كُتابها بدقة. لو كانت الآلة قادرة على التعرف عليهم بشكل صحيح، أو على الأقل التعرف على أغلبيتهم بشكل صحيح، فسوف يعني هذا أنَّ النموذج صالح للعمل، ويمكن من ثم تطبيقه على مقال الرأي المجهول.

وكما هو الحال مع طريقة ليونارد، فهذا أمرٌ صعبٌ عندما لا يكون هناك ما يكفي من مقالات الرأي للبحث عنها. أما ما فعله محققو الإنترنت فهو ما يدعوه ديهغاني بـ"التصنيف العابر المجال"، من خلال أخذ لغة التغريدات ومقارنتها بالمقالات.

وقال ديهغاني إنَّ هذا أمر صعب؛ لأنَّ الناس يتواصلون بشكل مختلف على منصات مختلفة.

وقد أسقطت الكثير من تحليلات المقال التي نُشرت على الإنترنت، والتي استخدمت TF-IDF ما يسميه "كلمات التوقف" التي نستخدمها لربط الأفكار معاً مثل: من، والذي، وال، وإلخ. قد تبدو هذه الكلمات غير مهمة لتحليل حاسوب، لكنَّ ديهغاني يقول إنَّها في الواقع تعمل بصفتها "مؤشرات غير مباشرة على بناء الجملة" وإسقاطها يزيل أجزاءً من اللغز.

وقال ديهغاني: "أياً كانت الطريقة التي نستخدمها فإنَّها تحتاج تضمين معلومات حول النوايا والمعلومات الأعمق أكثر من مجرد (التعامل معها باعتبارها) مجموعة من الكلمات فحسب. إنَّ تحليل دلالات الألفاظ أمر مهم، لكنَّ بناء الجملة هو المفتاح. نحن بحاجة إلى خبراء بشريين للتعليق على هذا المقال المتضمن لنوايا المؤلف".

لكن، ماذا لو كانت نية المؤلف خداعنا؟ إنَّ افتراض أنَّ كاتب المقال صريح وأمين وضعيف، وأنه يعطي قرائن عن قصد من خلال استخدام كلمات بعينها لا يعدو كونه افتراضاً.

وحذر كل من ديهغاني وليونارد من أنَّ الكاتب من المحتمل أنه متقدم على الجمهور بخطوة. فربما يكون هذا الكاتب يقلد أسلوب شخص آخر أو يضيف كلمات غير معتادة بغرض التضليل.

إضافة إلى ذلك، فمن المحتمل أنَّ هذه المقال قد روجعت بغرض جعل النص أكثر تماسكاً ووضوحاً، وهو ما من شأنه أيضاً إيضاع "المفاتيح" وجعل النص أصعب من حيث التحليل من الكتابات الحرة لتيد كازينسكي.

وقال ليونارد: "عندما يكون لديك وثائق كتبها شخص ما بصراحة دون التفكير فهذا ما يمكن تحليله، فهذا هو ما نبحث عنه".

ـــــــــــــــ

اقرأ أيضاً

ضابطة تقتل جارها بعد أن دخلت منزله بالخطأ

علامات:
تحميل المزيد