أفضل صديق للعلماء.. جوجل يطلق محرك بحث جديداً يساعد العلماء في الحصول على البيانات التي يبحثون عنها في مكان واحد

لطالما كان هدف جوجل هو تنظيم معلومات العالم، وتمثّل الهدف الأول في تنظيم بيانات الويب التجاري. أما الآن، فترغب الشركة في أن تقوم بالأمر ذاته للمجتمع العلمي، وذلك بإطلاق محرك بحث جديد لمجموعة البيانات.

عربي بوست
تم النشر: 2018/09/09 الساعة 13:29 بتوقيت غرينتش
تم التحديث: 2018/09/09 الساعة 13:29 بتوقيت غرينتش

لطالما كان هدف جوجل هو تنظيم معلومات العالم، وتمثّل الهدف الأول في تنظيم بيانات الويب التجاري. أما الآن، فترغب الشركة في أن تقوم بالأمر ذاته للمجتمع العلمي، وذلك بإطلاق محرك بحث جديد لمجموعة البيانات.

تم إطلاق هذه الخدمة التي تحمل اسم Dataset Search، في الخامس من سبتمبر/أيلول، حيث ستكون بمثابة الرفيق المساعد لمحرك البحث جوجل سكولار، وهو أحد محركات البحث الشائعة للشركة، المخصص للدراسات والتقارير الأكاديمية، حسب موقع The Verge الأميركي.

ستحتاج المؤسسات التي تنشر بياناتها عبر الإنترنت، كالجامعات والحكومات، إلى تضمين خدمة وصف البيانات في صفحات الويب الخاصة بها، التي ستقوم بوصف كل بياناتها، بما في ذلك من قام بإنشائها ووقت نشرها وطريقة جمعها وما إلى ذلك.

وسيتم تنظيم هذه المعلومات من خلال محرك البحث Dataset Search، ومن ثم ستدمج مع المدخلات من الرسوم البيانية المعرفية لجوجل (وهي اسم تلك المربعات المنبثقة خلال عمليات البحث الشائعة. على سبيل المثال، إذا نشرت المنظمة الأوروبية للأبحاث النووية مجموعة من البيانات، فسيتم أيضاً تضمين بعض المعلومات عن المنظمة في النتائج).

dataset

توحيد أنظمة تخزين البيانات على الإنترنت

وفي حديثها لموقع The Verge، قالت ناتاشا نوي، وهي عالمة في أبحاث جوجل للذكاء الإصطناعي، التي ساعدت في إنشاء محرك البحث الجديد Dataset Search، إن "الهدف من هذا المحرك هو توحيد عشرات الآلاف من أنظمة التخزين المختلفة لمجموعة البيانات عبر الإنترنت". وأضافت نوي: "نريد أن نجعل هذه البيانات قابلة للاكتشاف، ولكن عليك أن تبقيها في مكانها".

في الوقت الحالي، تعتبر المعلومات مبعثرة إلى درجة كبيرة. وتمتلك المجالات العلمية المختلفة أنظمة تخزين مفضلة خاصة بها، وهو تماماً ما تفعله الحكومات والسلطات المحلية المختلفة. وأوردت نوي أن "العلماء يقولون إنهم يعرفون المكان الصحيح، للعثور على البيانات التي يحتاجون إليها، ولكن هذا ليس ما يريدونه دائماً، فبمجرد أن يخرجوا من مجتمعهم الفريد، عندها يصبح الأمر صعباً".

وقدمت نوي مثالاً لعالمة مناخ تحدثت إليها مؤخراً، حيث أخبرتها أنها تبحث عن معلومات محددة حول درجات حرارة المحيط لإحدى دراساتها القادمة ولكنها لم تتمكن من العثور عليها في أي مكان. ولم تتمكن هذه العالمة من إيجاد أي معلومة، إلا عندما قابلت أحد الزملاء في مؤتمر، كان قد عثر هو على هذه البيانات، حيث أخبرها أين يمكن أن تعثر عليها، وحينها فقط تمكنت من مواصلة أبحاثها. وفي هذا الصدد، أفادت نوي أنه "لم يكن هذا بالتحديد مستودعاً لتخزين المعلومات، فقد كانت البيانات موجودة في مكان بارز إلى حد ما، ولكن كان لا يزال من الصعب العثور عليها".

وسيغطّي الإصدار الأول من محرك البحث Dataset Search العلوم البيئية والاجتماعية والبيانات الحكومية، بالإضافة إلى مجموعة من البيانات من المؤسسات الإخبارية مثل ProPublica. ومع ذلك، إذا أصبحت هذه الخدمة شائعة، فإن حجم البيانات التي تقوم بتصنيفها يجب أن يتزايد بسرعة، بينما تتدافع المؤسسات والعلماء لجعل معلوماتهم متاحة للجميع.

عصر ازدهار البيانات المفتوحة

ومن المفترض أن يساعد ذلك في ازدهار مبادرات البيانات المفتوحة في جميع أنحاء العالم. وفي هذا السياق، قالت نوي: "أعتقد  أن عدد أنظمة تخزين المعلومات قد ازداد بشكل كبير خلال السنوات القليلة الماضية". وركَّزت نوي على الاهتمام المتزايد بالبيانات المرتبطة بالكتب العلمية، وهذا يعني أن المجلات أصبحت تطلب من المؤلفين نشر الكثير من المعلومات، كما ركزت أيضاً على الاهتمام باللوائح الحكومية في الولايات المتحدة وأوروبا، والصعود العام لحركة البيانات المفتوحة".

قالت جيني تينيسون، وهي الرئيسة التنفيذية لمعهد Open Data Institute إن "انضمام شركة جوجل سيُساعد في نجاح هذا المشروع". وأضافت تينيسان أنه "لطالما كان العثور على البيانات في محركات البحث أمراً صعباً، لذا آمل أن يساعد انضمام جوجل في جعل عملية البحث أسهل". كما أفادت تينيسون أنه "لإنشاء محرك بحث مناسب، ستحتاج إلى معرفة كيفية بناء أنظمة سهلة الاستخدام وفهم ما يعنيه الناس عندما يكتبون بعض العبارات، فجوجل مثلاً يعرف ما الذي يجب فعله في كل من هذين القسمين".

يمكن أن يكون محرك البحث الجديد أفضل صديق للعلماء

وأوضحت تينيسون أن "شركة جوجل ستقوم بنشر مجموعة من البيانات الخاصة بها، حول كيفية استخدام محرك بحث Dataset Search. وعلى الرغم من أن علامات البيانات الوصفية التي تستخدمها الشركة لجعل البيانات مرئية لزواحف البحث الخاصة بها، هي عبارة عن معيار مفتوح (بمعنى أن أي منافس، مثل محرك البحث Bing أو Yandex يمكنهم استخدامها لبناء خدمة منافسة خاصة بهم)، إلا أن محركات البحث ستتحسن كلما قام عدد كبير من المستخدمين بإضافة معلومات حول ما يفعلونه.

كما أوردت تينيسون أن "فهم الطريقة التي يعتمدها الناس للبحث عن المعلومات أمر مهم، مثل نوع المصطلحات التي يستخدمونها، وكيف يعبرون عنها". وأضافت تينيسون أنه "إذا كنا نرغب في التحكم في كيفية بحث الأشخاص عن البيانات وجعلها متاحة بشكل أكبر، فسيكون من الرائع أن تكشف جوجل عن معلوماتها الخاصة بخصوص هذا الشأن". بمعنى آخر، يجب على جوجل نشر تعليمات حول البيانات التي سيتم تصنيفها بواسطة محرك البحث Dataset Search. فما الذي يمكن أن يكون ملائماً أكثر يا ترى؟