المعلوماتية > الذكاء الصنعي

كيف ساعد تعلم الآلة شبكاتِ التواصل الاجتماعي على الحد من الحسابات المزيفة؟

أصبحت الشبكات الاجتماعية عبر الإنترنت (OSNs) -مثل Facebook وTwitter- وسيلةً شائعة لإنشاء ملفات التعريف الشخصية والنصوص والصور والتسجيلات الصوتية ومقاطع الفيديو ومشاركتهم، وللبحث عن أصدقاء وتكوين صداقات؛ مما يسهل على المستخدمين التفاعل مع الناس في جميع أنحاء العالم (3).

تستخدم معظم الشركات الشبكات الاجتماعية (social networks) للإعلان عن أعمالها والترويج لها عبر الإنترنت، كذلك تستخدمها المنظمات الحكومية منصاتٍ لتقديم الخدمات الحكومية للمواطنين بطريقة فعالة، وإعلامهم وإبلاغهم عن المواقف المختلفة.

يؤدي مثل هذا الاستخدام المُكثَّف للشبكات الاجتماعية إلى نشر كمية هائلة من المعلومات التي يعتمد المستخدمون عليها على نحو كبير، والتي تؤثر -على نحو مباشر أو غير مباشر- في آرائهم.

مع وجود 1.44 مليار مستخدم نَشِط شهريًّا، تولَّد كميات كبيرة من البيانات، وبحلول عام 2025 لن تتمكن حتى مراكز بيانات Google من التعامل مع هذا الحجم الضخم من البيانات، وقد أدى انتشار الشبكات الاجتماعية إلى زيادة نمو صناعة السوق السوداء وتقديمها خدماتٍ غير قانونية؛ مثل شراء الإعجابات على Facebook والتعليقات والمشاركات (3).

ومحاولةً للسيطرة على ذلك ونوعًا من أنواع التحكم؛ التُفِت إلى موضوع الحسابات المزيفة؛ إذ تؤدي الزيادة فيها إلى نمو أسي في حجم البيانات، واقتُرِحت بنية لتحديد الحسابات المزيفة في الشبكات الاجتماعية وخاصة في Facebook، وذلك باستخدام تعلم الآلة (Machine Learning) لتطبيق تنبؤ أفضل لتحديد الحساب المزيف بناءً على مشاركات هذه الحسابات وحالتهم على شبكات التواصل الاجتماعي (2،4).

ووفقًا للإحصائيات، أصبح كلٌّ من فيس بوك وإنستغرام يعجّان بالحسابات المزيفة (fake accounts) وتُتداول المعلومات المزيفة عبرها، وهنا يجب على الشركات حذف تلك الحسابات لتوفير مساحة في مراكز البيانات وإيقاف الفوضى في المجتمع والشائعات وتأثيرها في القضايا الاجتماعية والسياسية (2،4).

وبالنظر إلى Facebook؛ تُصنَّف الحسابات المزيفة إلى ما يسمّيه Facebook بالحسابات المكررة والحسابات الزائفة، ويشير الحساب المكرر إلى حساب يحتفظ به المستخدم بالإضافة إلى حسابه الرئيسي.

تُقسَم الحسابات المزيفة إلى فئتين (2،4):

حسابات خاطئة من قبل المستخدم: تمثّل الملفات الشخصية التي ينشِئُها المستخدمون لشركة أو مؤسسة أو كيان غير بشري مثل حيوان أليف (تسمح شروط الخدمة في Facebook لمثل هذه الكيانات بالوجود كصفحة بدلًا من ملف شخصي).
وحسابات غير مرغوب فيها: هي ملفات تعريف المستخدمين التي يُقصَد استخدامها لأغراض تنتهك شروط خدمة Facebook؛ مثل البريد الإلكتروني العشوائي.

ووفقًا لمراجعة داخلية بواسطة Facebook على عينة محدودة من حساباتها في عام 2013، فإن قرابة 4.3٪ إلى 7.9٪ من المستخدمين النشطين شهريًا يمثّلون حسابات مكررة.

وفي العام نفسه، قُدّر عدد الحسابات المصنفة خاطئًا من المستخدم بنحو 0.8٪ إلى 2.1٪، في حين قُدِّرت الحسابات غير المرغوب فيها بين 0.4٪ و 1.2٪ تقريبًا (2،4).

كيف يمكننا تحديد الحساب المزيف؟

ليس من الممكن تمامًا تحديد ذلك بسهولة عن طريق الحالة أوالمشاركات، فيجب علينا التعمُّق قليلًا والتحقيق في الحساب. لدينا بعض المفهومات والنقاط التي نحتاج متابعتَها والتحقق منها قبل إنشاء أي حساب على الشبكة الاجتماعية، إضافة إلى كيفية تمييز الحسابات الحالية الحقيقية.

سنحاول شرح الأساليب الحالية المتّبعة في الشبكات الاجتماعية التي يُركَّز عليها لتحديد أنموذج التنبؤ الأفضل (prediction model) للتحقق من الحسابات.

رتبت Facebook بعض الخطوات الأساسية في عملية الكشف والتنبؤ عن الحسابات المزيفة:

جمع البيانات المرتبطة بالحسابات الحقيقية والمزيفة: نظرًا إلى إعدادات الخصوصية الصارمة في Facebook -إذ يضيف كل إصدار مزيدًا من القيود التي تحمي خصوصية المستخدم-؛ فقد أصبح جمع بيانات حسابات المستخدمين تحديًا كبيرًا.
استخدام "feed information" لفهم طبيعة نشاط الملف الشخصي (profile) وتحليلها وتحديد مجموعة واسعة من النقاط التي تؤدي دورًا رئيسيًّا في التمييز بين المستخدمين المزيفين على Facebook والمستخدمين الحقيقيين.
تحديد النقاط الواجب إدخالها في أنموذج تعلم الآلة لكي يساعد في مهمة الكشف عن الحسابات المزيفة.
تحديد نوع الأنشطة (مثل التعليق، والإشارة tagging، والمشاركة ...إلخ) التي تساهم أكثر في اكتشاف المستخدم المزيف.

تشير النتائج إلى أننا تمكّنا من تحقيق دقة تصنيف بنسبة 79٪، وعلى الرغم من أنها ليست مثيرة للإعجاب تمامًا؛ فإنّه يمكن التعامل معها بوصفها قاعدة جيدة لمزيد من التحسينات.

تشير النتائج أيضًا إلى أنّ عديدًا من المستخدمين المزيفين يُصنَّفون على أنهم حقيقيون؛ مما يشير بوضوح إلى أن الحسابات المزيفة تحاكي سلوك المستخدم الحقيقي للتهرب من آليات الكشف (4-2).

بالنظر إلى Twitter أيضًا، كما نعلم الآن أن twitter mining هو التطبيق المعروف للأبحاث، ويمكننا الحصول على مجموعة البيانات العامة (public dataset) الخاصة به التي تساعدنا في موضوعنا.

نحن بحاجة إلى الحصول على معلومات عن الأشخاص الذين ينشرون بعض الأشياء غير المرغوب فيها، ويجب التقاطهم وإزالتها قبل أن تخلق مشكلة.

لإنشاء حساب على Twitter؛ فإنه سيطلب بعض الأشياء مثل معرِّف البريد الإلكتروني أو رقم الهاتف، وهنا يُنشئ الناس حسابات بريد مزيفة. في حال كنت تجد أشياء غير لائقة على هذه المنصات، فنحن بحاجة إلى إيجادها والحد منها قبل الانتشار والوصول إلى الآخرين (1).

شبكة اجتماعية أخرى سنأخذها بعين النظر وستُطبَّق الدراسة عليها هي Instagram، فهو يشتهر بمتابعة المشاهير وصفحات المعجبين على مستوى العالم (1).

تزداد الحسابات المزيفة في Instagram أكثر من Facebook يومًا بعد يوم، ويعد أكثر شيوعًا في انتشار الأخبار المزيفة وإنشاء محتوى يمكن الإبلاغ عنه، فإذا نظرنا إلى Instagram فترةً من الوقت؛ سنجد بعض الأشخاص الذين فعلوا أمورًا غير لائقة من أجل المال عن طريق هذه المنصة؛ فقد نشروا بعض الكلمات غير المقبولة أو عرضوا صورًا في خاصية القصة Story الخاصة بهم وستعرض هذه القصة مدة 24 ساعة! لذلك نحن بحاجة إلى مثل هذه الدراسات وتوظيف الذكاء الصنعي (1).

نستطيع القول إنه مع تطور التكنولوجيا -وخاصة في مجالات تعلم الآلة والذكاء الصنعي- أصبحت الشبكة الاجتماعية قادرةً بسهولة على اكتشاف أغلب الحسابات المزيفة وتعطيلها (1).

المصادر:

1- MIT Technology Review. 2020. How Facebook Uses Machine Learning To Detect Fake Accounts. [online] Available at: <هنا; [Accessed 19 June 2020].

2- Acadpubl.eu. 2018. Machine Learning Implementation For Identifying Fake Accounts In Social Network. [online] Available at: <هنا; [Accessed 19 June 2020].

3- Ieeexplore.ieee.org. 2017. Towards Detecting Fake User Accounts In Facebook - IEEE Conference Publication. [online] Available at: <هنا; [Accessed 19 June 2020].

4- Yousuf Wani، S.، Immamul Ansarullah، S. and Kirmani، M.، 2016. [online] ResearchGate. Available at: <هنا; [Accessed 19 June 2020].