المعلوماتية > عام

سرعةٌ وتنظيم وسهولة أكثر مما اعتدتم؛ محرّك بحث شركة غووغل الجديد.

Dataset Search؛ خدمة جديدة أطلقتها شركة جوجل لمساعدة العلماء والتقنيين وكلّ من له اهتمام أو فضول؛ وذلك من أجل تسهيل وصولهم إلى قواعد البيانات التي يحتاجونها.

ستسهل Dataset Search الوصولَ إلى قواعد البيانات أينما استُضِيفَت؛ سواءً في موقع إلكتروني أو مكتبة رقمية أو المدوّنات الخاصة بشكل مشابه لما تفعله ميزة Google Scholar.

هل هناك حاجة حقيقية لهذه الميزة في البحث؟

من الصعب تحديد مكان وجود قاعدة بيانات محددة إذا ما نظرنا لحجم مستودعات البيانات المتاحة على الإنترنت، وتحديد فيما إذا كانت هذه البيانات موثوقة أم لا، ولذلك؛ وانطلاقاً من الحاجة الملحة لتسهيل الوصول إلى قواعد البيانات؛ بنَت جوجل هذه الخدمة و أطلقتها لتجعل البحث عن هذه القواعد بسهولة الوصول لوصفة طعامك المفضّل!.

كيف تعمل Dataset Search؟

اتبعت جوجل الطريقة نفسها التي سبق أن استخدمتها في أرشفة المحتوى الرقمي؛ ألا وهي طريقة هيكلة البيانات Structured Data؛ إذ وضعت إرشادات لمُنشئِي قواعد البيانات من أجل توصيف بياناتهم بطريقة تمكنها -و تمكّن محركات البحث الأخرى- من فهم محتوى هذه القواعد على نحوٍ أفضل.

وتتضمن هذه الإرشادات ذكر أهم ما يميز قواعد البيانات: من أنشأها؟ متى نُشرت؟ كيف جُمعت البيانات فيها؟ … إلخ؛ فتمثّل هذه التوصيفات ما يشبه الكلمات المفتاحية التي نكتبها عادة في صندوق البحث في محرك بحث جوجل عند حاجتنا لأيّة معلومة.

تجمعُ جوجل بعد ذلك هذه المعلومات وتربطها وتحلل مختلف الإصدارات من مجموعة البيانات نفسها، وتبحث عن منشورات تَصفُ مجموعات البيانات هذه، وتعتمد جوجل في منهجيتها على معيار مفتوح المصدر (هنا) لوصف البيانات؛ كي يلتزم به كل من لديه قاعدة بيانات.

ما التّحديات التي واجهتها جوجل خلال تطوير الميزة؟

- تحديدُ تعريفٍ واضح لقواعد البيانات: يشير مصطلح قواعد البيانات بالعموم إلى مجموعة من الجداول المرتبطة ببعضها، والمكوَّنة من عناصر منفصلة، ولكن يمكن معالجتها عل أنّها مجموعة من قبل الحاسوب، وبناءً على هذا التعريف؛ هل يمكن عدُّ جدولٍ واحد على أنّه قاعدة بيانات؟ ماذا عن مجموعة من الصور؟

- تحديد مجموعات البيانات: عادة ما تُعرَّف قواعد البيانات بقيمٍ مفتاحية فريدة تمثل المعرّفات، ولكن؛ هل هي معرّفات فريدة دائمًا؟ هل يمكن عدُّ الـ URL معرِّف جيد؟

- ربط قواعد البيانات ببعضها: من الممكن أن تُوصِّف جهتان قاعدة البيانات نفسها، وفي حال حدوث ذلك؛ أيّ التوصيفين سيُعتمَد؟ وكيف ستحدثُ عمليّة اختيار الأكثر دقة بينهما؟

- وصف محتوى قاعدة البيانات: ما هو مقدار المحتوى الواجب توصيفه لتمكين خاصية البحث؟ وما الذي يمكن فعله عندما يكون المحتوى غير مرخص للاستخدام؟

ما الفائدة التي يجنيها موفّرو/ أصحاب قواعد البيانات؟

يقول Ed Kearns رئيس قسم البيانات في NOAA: "لطالما كان هذا النمط من البحث حلم العديد من الباحثين في مجتمعات البيانات، وبالنسبة إلى الإدارة الوطنية للمحيطات والغلاف الجوي (NOAA)؛ فإن هذه الأداة هي المفتاح لجعل بياناتنا سهلة الوصول إلى نطاقٍ أوسع من المستخدمين."

ما الذي يمكنك فعله إذا نشرت بيانات ولم تجدها عند استخدامك لهذه الميزة؟

يمكنك الاطلاع على التعليمات بزيارتك موقع المطورين (هنا)، ويمكنك تقديم التغذية الراجعة أيضًا.

مصادر المقال

هنا

هنا