كيفية اكتشاف أخبار وهمية في الوقت الحقيقي

بسرعة كافية لتمكين البشر من اتخاذ الإجراءات اللازمة

وضعت DART في الوقت الحقيقي لأنظمة مراقبة تسونامي على بعد آلاف الأميال من الشاطئ تساعد في التنبؤ بالتسونامي قبل أن تصبح تهديدًا. (الصورة: مركز نوا لأبحاث التسونامي)

في نوفمبر الماضي ، أخبرني صديق عن عائلته الممتدة من الفلبينيين الأمريكيين في منطقة فريسنو. في غضون أيام ذهبوا من الشعور بالضيق حول ترشيح ترامب للتصويت له بشكل جماعي. إنهم كاثوليك ، وبمجرد أن سمعوا أن البابا قد أيد ترامب كانت عقولهم مكبلة. بالطبع ، هذا التأييد البابوي لم يحدث بالفعل. هذا مثال على موجة الأخبار المزيفة التي ذهبت إلى الملايين ومضللتهم.

هذه هي القصة نفسها في منشور على Facebook ، تشاركه مجموعة North Carolina For Donald Trump. لديهم 65000 متابع ، ويمكنك أن ترى كيف يمكن للعشرات من المجموعات المؤثرة نشر هذا إلى الملايين.

على نفس المنوال ، نشر موقع يسمى windemocrats.com خدعة تقول إن أيرلندا تقبل رسميًا "لاجئي ترامب" ، والتي حصلت أيضًا على الكثير من اللعب. هذه مشكلة من الحزبين. الصحافة عمل شاق. الأخبار المزيفة للتأثير والربح سهلة للغاية. هنا المزيد من الأمثلة.

هذا جعلني أتساءل ما الذي كان بوسع Facebook ومنصات أخرى فعله للكشف عن موجات المعلومات الخاطئة هذه في الوقت الفعلي. هل يمكن أن يديروا تدابير مضادة؟ إذا تم الكشف عنها في الوقت المناسب هل كان بإمكانهم إبطاء الانتشار أو وضع علامة عليه كأخبار غير موثوقة؟

منصات تحتاج إلى العمل

كما لاحظ الكثيرون ، من الأفضل القيام بمعالجة الأخبار المزيفة على مستوى المنصات الرئيسية - Facebook و Twitter و Google و Microsoft و Yahoo و Apple. إنهم يسيطرون على الشرايين التي تتدفق عبرها معظم المعلومات الحديثة في العالم وتأثيرها. هم في وضع أفضل لرؤية اندلاع تضليل تشكيل. لدى فرقهم الهندسية القطع التقنية لاكتشافها والمقابض اللازمة للرد عليها.

تتمتع كل من الشبكات الاجتماعية ومحركات البحث بأذرع هندسية (اعتقد: مرونة الترتيب) وخيارات المنتج لتقليل التعرض أو تحديد أمواج كاذبة أو إيقاف موجات التضليل بالكامل. سوف يتخذون هذه القرارات بشكل فردي بناءً على شدة المشكلة وكيف تقوم منظمتهم بموازنة دقة المعلومات وحرية المؤلف. يركز بحث Google على الوصول إلى المعلومات. فيسبوك يرى نفسه كميسر للتعبير. قد يحلوا الأمور بطريقة مختلفة.

سوف يركز نهجنا بدرجة أقل على حظر المعلومات الخاطئة ، والمزيد من التركيز على عرض وجهات نظر ومعلومات إضافية ، بما في ذلك مدققي الحقائق الذين يشككون في دقة عنصر ما. - مارك زوكربيرج

في هذه المقالة ، أفضل عدم الدخول في السياسة ، وأود التركيز على الكشف بدلاً من الدعوة إلى استجابة محددة. بغض النظر عن إجابتك ، إذا كنت تستطيع اكتشاف أخبار مزيفة في الوقت الفعلي ، فيمكنك فعل شيء حيال ذلك.

لا يعني الاكتشاف في الوقت الفعلي ، في هذا السياق ، ثوانٍ. قد لا يكون من الضروري اتخاذ إجراء إذا لم ينتشر. في الممارسة العملية ، قد تعني الاستجابة السريعة دقائق أو ساعات. ما يكفي من الوقت لخوارزمية لاكتشاف موجة من الأخبار التي تبدو مشبوهة وتجمع الزخم ، وربما من مصادر متعددة. أيضا ، ما يكفي من نافذة لجمع الأدلة والنظر فيها من قبل البشر الذين قد يختارون إيقاف الموجة قبل أن تتحول إلى تسونامي.

أعرف شيئًا أو اثنين حول خوارزميات تعالج الأخبار. لقد بنيت أخبار Google وقمت بتشغيلها لسنوات عديدة. في اعتقادي أن الكشف يمكن تتبعه.

أعلم أيضًا أنه من المحتمل ألا تكون فكرة جيدة أن تدير أي شيء آخر غير الإجراءات المضادة قصيرة الأجل فقط بناءً على ما تقوله الخوارزمية. من المهم إشراك البشر في الحلقة - سواء من أجل مساءلة الشركات أو العمل بمثابة فحص عقلاني. على وجه الخصوص ، سيكون الحكم البشري قادرًا على التحقق من الحقائق بشكل استباقي. في المثال أعلاه ، كان بإمكان ممثل Facebook أو Twitter الاتصال بالمكتب الصحفي للكرسي الرسولي وأثبت أن القصة خاطئة. إذا لم يكن هناك شخص واضح يمكن الاتصال به ، فيمكنه التحقق من أهم مصادر الأخبار ومواقع التحقق من الحقائق للحصول على قراءته للموقف.

سيكون هناك حالات غامضة وحالات يكون التحقق فيها بعيد المنال. قد يقرر المحكمون البشريون الانتظار ومراقبة الموجة لفترة من الوقت قبل أن يتدخلوا. بمرور الوقت ، يمكن لنظام التعلم الآلي أن يتعلم من النتيجة ، ويبدأ في استخدام المزيد من الأدلة ، ويدرب نفسه ليصبح أكثر ذكاء.

ما هي الموجة؟ موجة في لغتي هي مجموعة من المقالات التي تقدم نفس المطالبة الجديدة (وربما الخاطئة) ، بالإضافة إلى مشاركات وسائل التواصل الاجتماعي المرتبطة بها. موجة كبيرة إذا كان ينمو في الاشتباك. نظرًا لأن تكلفة التدخل البشري مرتفعة ، فمن المنطقي الإشارة إلى الموجات الهامة التي لها سمات تشير إلى معلومات خاطئة.

الهدف من خوارزمية الكشف هو الإبلاغ عن الموجات المشبوهة قبل عبورها حد التعرض ، بحيث يمكن للمستجيبين البشريين فعل شيء حيال ذلك.

لجعل هذا ملموسًا: دعنا نقول أن منصة التواصل الاجتماعي قررت أنها تريد معالجة الأخبار المزيفة بالكامل بحلول الوقت الذي تحصل فيه على 10000 سهم. ولتحقيق ذلك ، قد يرغبون في وضع علامة على الموجة عند 1000 سهم ، بحيث يكون لدى المقيِّمين البشر الوقت لدراستها والاستجابة لها. للبحث ، يمكنك حساب الاستعلامات والنقرات بدلاً من المشاركات وقد تكون العتبات أعلى ، لكن المنطق الكلي هو نفسه.

كشف حسابي

لاكتشاف السلوك الشاذ يجب أن ننظر أسفل السطح ونرى ما لا يحدث. هذا ، من قصة شرلوك هولمز يجسد جوهر استراتيجيتنا.

غريغوري (محقق سكوتلاند يارد): "هل هناك أي نقطة أخرى تود لفت انتباهي إليها؟
شرلوك هولمز: "إلى الحادث الغريب للكلب في الليل".
غريغوري: "الكلب لم يفعل شيئًا في الليل".
شرلوك هولمز: "كان هذا هو الحادث الغريب".
- مغامرة الحريق الفضي ، آرثر كونان دويل

إن ما يجعل اكتشاف الأخبار المزيفة قابلاً للتتبع هو أن المنصات قادرة على مراقبة المقالات والمنشورات ، ليس فقط بمعزل عن غيرها ، ولكن في سياق كل ما يقال حول هذا الموضوع في الوقت الفعلي. هذا السياق الموسع وفي الوقت المناسب يجعل كل الفرق.

لنأخذ قصة "البابا تؤيد ترامب".

إذا كنت مستخدمًا متوسطيًا على Facebook وتمت مشاركة المقال بواسطة صديق ، فلا يوجد سبب يدعو إلى عدم التصديق. لدينا تحيز للحقيقة يجعلنا نرغب في تصديق تنضيد الأشياء في تنسيق إحدى الصحف ، خاصة إذا كان معتمدًا من قِبل شخص تعرفه. وبالتالي ، فإن ثمرة مواقع الأخبار المزيفة حديثًا والتي تحاول أن تبدو مشروعة. بعض من قبل المراهقين المقدونيين ، من أجل الربح فقط ، أو من قبل المهنيين السياسيين أو الجهات الفاعلة الأجنبية التي تسعى للتأثير على الانتخابات. عندما يتم وضع علامات عليها ووضعها على قوائم سوداء ، يتم إنشاء مواقع جديدة بدافع الضرورة.

قد يسأل أحد المتشككين: ما مدى احتمالية كون موقع endthefed.com ، وهو مصدر غامض نسبيًا ، هو أحد أول من يروي قصة عن تأييد البابا لترامب ، في حين أن مصادر راسخة مثل نيويورك تايمز وواشنطن بوست وبي بي سي وفوكس نيوز ، سي إن إن ، إلخ ، وحتى خدمة أخبار الفاتيكان ، ليس لديهم ما يقولونه حول هذا الموضوع؟ هذا يبدو غير طبيعي. سيكون الأمر أكثر إثارة للشك إذا كانت مجموعة المواقع الإخبارية التي تتحدث عن هذا مسجلة حديثًا أو لديها سجل في تشغيل الأخبار المزيفة. هذا هو المنطق الذي سنستخدمه ، ولكن مع بعض الأتمتة.

للقيام بذلك على نطاق واسع ، ستنظر الخوارزمية في جميع المقالات الحديثة (من المصادر المعروفة والغامضة) التي بدأت تلعب دورًا في آخر 6-12 ساعة على شبكة اجتماعية معينة أو محرك بحث معين. لتقييد النطاق ، قد نحتاج إلى تطابق مع بعض مصطلحات التشغيل (مثل أسماء السياسيين أو الموضوعات المثيرة للجدل) أو فئات الأخبار (مثل السياسة أو الجريمة أو الهجرة). هذا من شأنه أن يقلل من المجموعة إلى حوالي 10000 مقالة. يمكن تحليل هذه المقالات وتجميعها في مجموعات قصص ، استنادًا إلى السمات الشائعة - الكلمات الرئيسية المهمة والتواريخ والاقتباسات والعبارات ، وما إلى ذلك. يقوم علماء الكمبيوتر بذلك منذ عقود ويسمونه "تجميع المستندات".

المقالات التي تهبط في دلو قصة معينة ستتحدث عن نفس القصة. تم استخدام هذه التقنية بنجاح في أخبار Google و Bing News ، لتجميع المقالات حسب القصة ومقارنة نشاط النشر بين القصص. إذا ذكر مصدران مختلفان "البابا" و "ترامب" وبعض المتغيرات لمصطلح "معتمد" في غضون فترة زمنية قصيرة ، فإن مقالاتهم ستنتهي في نفس المجموعة. هذا يساعدنا في الأساس على تغطية التغطية الكاملة للقصة ، عبر مصادر الأخبار المختلفة. أضف في السياق الاجتماعي ، أي المشاركات التي تشير إلى هذه المقالات ، ولديك الموجة الكاملة. الأهم من ذلك أن هذا يسمح لنا بمعرفة شاملة للمصادر والمؤلفين الذين ينشرون هذه الأخبار وأيها لا.

لتقييم ما إذا كان يجب الإشارة إلى الموجة على أنها مشبوهة ، ستحتاج الخوارزمية إلى النظر في سمات كل من مجموعة القصص وسحابة وسائل التواصل الاجتماعي المحيطة بها. على وجه التحديد:

  1. هل الموجة على موضوع مشحون سياسيا؟ هل يتطابق مع مجموعة من الكلمات الرئيسية الساخنة الزر التي يبدو أنها تجذب الحوار الحزبي؟
  2. هل ينمو الارتباط بسرعة؟ كم عدد المشاهدات أو الأسهم في الساعة؟
  3. هل يحتوي على مصادر أو مصادر منتفخة حديثًا لها نطاقات تم نقلها؟
  4. هل هناك مصادر لها تاريخ من الصحافة الموثوقة؟ ما هي نسبة إخراج الأخبار إلى الأعلام الحمراء؟
  5. هل هناك مصادر مشكوك فيها في الموجة
    (أ) المصادر التي تم الإبلاغ عنها للحصول على أخبار مزيفة من خلال مواقع التحقق من الواقع (مثل Snopes و Politifact)
    (ب) المصادر التي يتم مشاركتها بشكل متكرر على الخلاصات الاجتماعية مع مصادر الأخبار المزيفة المعروفة.
    (ج) المصادر التي تشبه الجهات المزودة المعروفة للأخبار المزيفة في انتمائها أو بنية موقع الويب أو سجل DNS ، إلخ.
  6. هل يتم مشاركته من قبل المستخدمين أو عرضه على المنتديات التي قامت بإعادة توجيه الأخبار المزيفة تاريخياً؟ هل يقوم المتصيدون أو منظري المؤامرة بنشرها؟
  7. هل هناك مواقع أخبار موثوق بها في المجموعة؟ مع مرور الوقت تصبح هذه إشارة قوية. قصة متنامية لا يتم التقاطها من قبل مصادر موثوقة مشبوهة.
  8. هل تم وضع علامة على بعض المقالات كمزيفة من قبل المستخدمين (الموثوق بهم)؟

كل ما سبق يمكن تقييمه بواسطة أجهزة الكمبيوتر. ربما لا ، ولكن بشكل جيد بما فيه الكفاية لتكون بمثابة إشارة. سيجمع بعض المنطق الذي تم إنشاؤه بعناية بين هذه الإشارات لإنتاج درجة نهائية لتقييم مدى اشتباه الموجة.

عندما تحتوي الموجة على سمات قصة إخبارية مزيفة ، يمكن للخوارزمية أن تضعها في صورة انتباه إنساني ، وقد تضع عليها الفرامل المؤقتة. سيؤدي ذلك إلى كسب الوقت والتأكد من أنه لا يتخطى العلامة المائية المرتفعة ، أي 10000 سهم أو آراء ، أثناء إجراء التقييم.

مع كل موجة يتم تقييمها بواسطة قضاة بشريين - وقد يكون هناك عشرات في اليوم - سيحصل النظام على تعليقات. وهذا بدوره يسمح بضبط معلمات net الحسابية / العصبية ويساعد على تمديد سجل التتبع للمصادر والمؤلفين والمنتديات. حتى الأمواج التي لا يمكن إيقافها في الوقت المناسب ، ولكن ثبت في النهاية أنها معلومات خاطئة ، يمكن أن تسهم في تحسين النموذج. مع مرور الوقت ، يجب أن يجعل هذا الكشف أكثر دقة ، مما يقلل من حدوث إنذارات خاطئة في خطوة الإبلاغ.

حرية التعبير وسوء المعاملة

تداول حرية التعبير للأمان هو منحدر زلق وفكرة سيئة بالتأكيد.

من المهم أن تتم مراقبة الأخبار المزيفة من خلال المنصات بطريقة يمكن الدفاع عنها وشفافة على حد سواء. يمكن الدفاع عنه ، بمعنى أنهم يشرحون ما يقومون به من الشرطة وكيف يتم تنفيذ ذلك ، ويعملون بطريقة يرتاحها الجمهور. أتوقع منهم أن يستهدفوا الأخبار المزيفة بشكل ضيق بحيث يشمل فقط الادعاءات الواقعية الخاطئة. يجب عليهم تجنب رأي الشرطة أو الادعاءات التي لا يمكن التحقق منها. المنصات تحب تجنب الجدل والتعريف الضيق والهش سيبقيهما خارج الغابة.

فيما يتعلق بالشفافية ، أتوقع أن يتم الكشف عن جميع الأخبار التي تم تحديدها على أنها مزيفة وتم إبطاؤها أو حظرها بشكل علني. قد يختارون تأخير هذا لتجنب الإمساك بأيديهم خلال دورة الأخبار ، لكن عليهم أن يكشفوا خلال فترة معقولة (على سبيل المثال ، 15 يومًا) عن جميع الأخبار التي تأثرت. هذا ، وقبل كل شيء ، سيمنع إساءة الاستخدام من قبل النظام الأساسي. لدى Google و Facebook وغيرها تقارير الشفافية التي تكشف عن طلبات الرقابة والمراقبة من قبل الحكومات وتطبيق القانون. من المناسب فقط أن تكون أيضًا شفافة بشأن الإجراءات التي تحد من الكلام.

بعد أن كنت على الجانب الآخر من هذه المشكلة ، يمكنني أن أفكر في الأسباب التي قد تجعل تفاصيل خوارزمية الكشف بحاجة إلى السرية. قد تجد منصة ، في سباق تسلح مع منتجي الأخبار المزيفة ، أن استراتيجيتهم تتوقف عن العمل إذا تم إعلان الكثير. هناك حل وسط يتمثل في توثيق تفاصيل التنفيذ وإتاحتها للفحص الداخلي من قبل (فريق من) الموظفين. أيضًا ، للتدقيق من قبل أمين المظالم أو المحامين الخارجيين المعتمدين. عندما يتعلق الأمر بتشجيع سلوك الشركات الجيد ، فإن خط الدفاع الأول. إنهم قادرون تقنياً ويأتون من مختلف الأطياف السياسية. يمكنهم تأكيد عدم وجود تحيز سياسي في التنفيذ.

أكبر تحد لإيقاف الأخبار المزيفة ليس تقنيًا. إنها الاستعداد التشغيلي.

حجم ونجاح منصاتنا الرئيسية جعل هذا الهجوم واسع النطاق على الحقيقة ممكنًا في المقام الأول. هم أيضا في وضع أفضل لإصلاحها. يمكنهم إعداد أجهزة استشعار ، وأذرع نقش ، وأخبار إسكواش مزيفة عن طريق حرمانها من حركة المرور والإيرادات.

ما يقلقني هو ما إذا كانت القيادة في هذه الشركات تدرك الضرورة الأخلاقية ولديها الإرادة للقيام بذلك على نطاق واسع ، واستثمار الهندسة اللازمة ، والعمل بجدية تستحقه. ليس لأنها مخادعة وتفيد أعمالهم - أعتقد بصدق أن هذا ليس عاملاً - ولكن لأنهم قد يعتقدون أنه صعب للغاية ولا يريدون أن يتحملوا المسؤولية عن الأخطاء والمفاتيح. لا يوجد عمل حتمى للقيام بذلك وقد تكون هناك اتهامات بالتحيز أو الرقابة ، فلماذا تهتم؟

إذا كانوا على استعداد لتجاوز هذا الحد وتملك المشكلة - وتشير الدلائل الحديثة إلى أنهم يفعلون ذلك (على سبيل المثال ، فيسبوك يدفعون مدققي الحقائق وترتيب التغييرات في Google) - أعتقد أن مستخدميهم والصحافة سيقدرونها ويدعمونها. من خلال الشفافية والاستجابة الصحيحة ، يمكنهم تقديم قدر هائل من الخير للمجتمع والتأكد من أن الديمقراطيات تعمل بشكل صحيح. البديل مخيف.