الرياضيات > توقعات كأس العالم 2014

تنبؤات منظمة Goldman Sachs ببطل مونديال البرازيل 2014 ج2

كيف تمت هذه العملية ؟

النموذج الإحصائي لمونديال 2014:

نقدم لكم النموذج الإحصائي لتوقعات مونديال كأس العالم القادم في البرازيل. وكانت عملية النمذجة كالتالي:

• تم بناء نموذج يقوم بتوليد توزيع عشوائي لنتائج جميع مباريات كأس العالم المرتقب، بدءاً من مباراة الافتتاح بين البرازيل وكرواتيا يوم 12 حزيران في ساو باولو، وصولاً إلى المباراة النهائية في 13 تموز في ريو دي جانيرو.

• تستند توقعات كل مباراة على تحليل الانحدار، وهو طريقة إحصائية يتم فيها التنبؤ بمتوسط متغير مجهول (وهو عدد الأهداف لفريق ما في مباراة معينة)؛ اعتماداً على قيم وقياسات متغيرات أخرى مستقلة (مكان المباراة و أفضلية اللعب ... إلخ). تحليل الارتباط في هذا النموذج يستخدم معاملات وقيم أخذت من المباريات الدولية الرسمية التي أقيمت منذ عام 1960 حتى اليوم. وهذا يعطينا مبدأياً حوالي 14 ألف قيمة و قياس لإدخالها في النموذج.

المتغيرات المستقلة في تحليل الانحدار هي:

1. الفرق في تصنيف ELO العالمي بين فريقين. تصنيف ELO يشير إلى مقياس النجاح فريق كرة القدم استناداً على كامل السجل التاريخي الخاص به. و على عكس تصنيف FIFA/Coca-Cola المعروف، فإن تصنيف ELO متوافر لكامل تاريخ مباريات كرة القدم الدولية. وإحصائياً، وجد الباحثون أن الفرق بين الفريقين في تصنيف ELO هو المتغير الأكثر تأثيراً في النموذج.

2. متوسط عدد الأهداف التي سجلها الفريق خلال آخر عشر مباريات دولية لعبها.

3. متوسط عدد الأهداف التي تلقاها من الفريق الخصم خلال آخر خمس مباريات دولية لعبها.

4. متغير خاص بكل بلد يشير إلى كون الفريق لديه ميل لينجح أو يفشل في كأس العالم. نضع هذا المتغير فقط بالنسبة للبلدان التي شاركت في عدد كافٍ من مباريات كأس العالم بعد عام 1960 (أي أن ذلك يشمل البرازيل وألمانيا والأرجنتين واسبانيا وهولندا وانكلترا وايطاليا وفرنسا).

5. متغير يشير إلى كون الفريق يلعب في بلده الأصلي.

6. متغير يشير إلى كون الفريق يلعب في قارته، مع وجود معاملات تختلف بحسب البلد في هذه القارة.

• قام الباحثون بعد ذلك بتوليد الاحتمالات لنتائج كل مباراة باستخدام محاكاة مونتي كارلو، و ذلك اعتماداً على القيم والمعطيات المأخوذة من تحليل الانحدار. تعتمد محاكاة مونتي كارلو على تكرار تجربة ما للحصول على توزيع احتمالي لمتغير معين، حيث يكون دخل هذه المحاكاة هو المعاملات و القيم المقدرة في تحليل الانحدار الموضحة أعلاه، ثم مراكمة النتائج الحالية مع النتائج السابقة وتكرار العملية عدداً محدداً من مرات (100 ألف مرة)، وتزداد الدقة مع زيادة عدد التكرارات. ثم نستخدم هذه النتائج لتوليد احتمال وصول كل فريق إلى مرحلة معينة من البطولة، وصولاً إلى من سيفوز بالبطولة. استُخدم توقع تقريبي لتحديد نتائج كل مباراة خلال مرحلة المجموعات، وتوقعات أكثر دقة لتحديد الفائز في مرحلة خروج المغلوب.

• هذا النموذج لا يستخدم أي معلومة عن نوعية اللاعبين الفردية التي لا تنعكس على مسار سجل الفريق الدولي. على سبيل المثال، حالة إصابة لاعب رئيسي كان مسؤولاً عن نجاحات فريق في الآونة الأخيرة لن يكون له تأثير على التوقعات. وأيضاً لا يوجد دور للحكم البشري باعتبار هذا النهج في التوقع إحصائي بحت.

وهكذا نبدأ من نموذج يفترض تساوي فرص التهديف لكل الفرق في كل المباريات، و تساوي احتمال الفوز بالكأس لكل الفرق، ثم نضيف المزيد من المعلومات على هذا النموذج، بما في ذلك الهيكل التنظيمي للبطولة، و المتغيرات المذكورة في تحليل الانحدار.

توقعات نتائج المباريات في مرحلة المجموعات ومرحلة خروج الخاسر غير دقيقة نظراً لأن لعبة كرة القدم تمتاز بعدد الأهداف المنخفض، والمفاجئات الكثيرة. ولهذا السبب فإن إدخال احتمال كل فريق للوصول إلى مرحلة معينة من نهائيات كأس العالم في النموذج؛ يقدم نتائج أفضل من النموذج الذي يعطي توقعات نتائج المباريات في المراحل السابقة.

صحة التوقعات الماضية في كأس العالم الذي أقيم في جنوب افريقيا 2010 :

بعد عرض النموذج الذي يحاكي توقعات كأس العالم 2014 يمكننا أن نسأل كم كانت نتيجة التوقعات في مونديال كأس العالم السابق قريبة من النتائج الحقيقية، علماً أن التوقعات تم بناءها على نفس النموذج تقريباً، وذلك بالاعتماد على المعلومات المتاحة فقط قبل بطولة 2010.

بالاطلاع على تلك التوقعات نلاحظ أن هناك علاقة إحصائية ملحوظة وإيجابية بين نتائج التوقعات المأخوذة من النموذج وبين النتائج الحقيقية. التطابق بين التوقعات وبين النتائج الفعلية (المقارنة بين عدد الأهداف بشكل رئيسي) في تحليل الانحدار كان بنسبة 24% فقط، وذلك لأن كرة القدم تمتاز بأنها لعبة عشوائية ومن الصعب توقع نتائجها.

يظهر لنا الجدول التالي التنبؤات الاحتمالية التي ولّدها نموذجنا في بداية بطولة 2010 و يمكن المقارنة بالنتائج الحقيقية التي وقعت في هذه البطولة، حيث يظهر الجدول أن النموذج الناتج لبرنامج التنبؤ توقع نتائج صحيحة وتأهل لـ13 فريق من أصل 16 فريق قد اجتازوا فعلاً الدور الاول من المونديال، وتوقع نتائج صحيحة وتأهل لـ5 فرق من أصل 8 قد تأهلوا فعلاً إلى مباريات الربع النهائي، وتوقع نتائج صحيحة وتأهل 3 فرق من أصل 4 قد وصلوا إلى مباريات النصف النهائي، ولكن هذا النموذج لم يتوقع في الحقيقة نتيجة أن اسبانيا ستفوز بكأس العالم.

ولكن يظهر النموذج أن اسبانيا كانت المرشحة الثانية لنيل اللقب بواسطة هذا النموذج وأخذت احتمالية 15.7 % للفوز بينما البرازيل اخذت الاحتمال الأول وهو 26.6 % بينما كانت هولندا لها الفرصة الثالثة لنيل اللقب حسب النموذج الذي تم طرحه قبل البطولة.

الخانات المظللة في الجدول هي التوقعات التي تحققت بالفعل في كأس العالم الماضي.

لفهم اكثر لهذا الجدول تابعونا في المقالة المقبلة من هذه السلسلة.

المصدر : هنا

مصدر الصور و الجداول : هنا