الرياضيات > الرياضيات

التعميم لمحة عن مبرهنة النهاية المركزية في الإحصاء

المجتمع في الإحصاء هو مجموعة كل الأشياء أو الأشخاص أو الأحداث موضع الدراسة أو الاهتمام. لكن في الواقع، جمع بيانات المجتمع كاملًا قد يحتاج إلى مجهود كبير وتكلفة مرتفعة، أو قد يكون غير ممكن من الأساس. مثلًا، ليس من الممكن اختبار كفاية أطباء التخدير في العالم في إجراء عملية جراحية ما لمريض وهو يقظ (1). 

ولعمل استقراء أو استدلال إحصائي (Statistical inference) لخصائص المجتمع تُؤخذ عينة ذات حجمٍ كافٍ من المجتمع (1). وليصح هذا الاستدلال، ينبغي أن تكون العينة ممثلةً عن المجتمع كاملًا، ولكن من النادر للعينات العشوائية أن تكون ممثلةً عن المجتمع. لذلك لا يمكن التعميم من عينة عشوائية واحدة -ذات حجم معين- مباشرة على المجتمع ككل، بل يجب أن يبنى هذا التعميم على التوزيع الاحتمالي للأوساط الحسابية لكل العينات العشوائية الممكنة لهذا الحجم، أي ما يُسمى توزيع المعاينة (sampling distribution) (2).

 هذا التوزيع الاحتمالي -بتمثيله للأوساط الحسابية لكل العينات الممكنة- يُنبئنا إذا ما كان الوسط الحسابي للعينة التي سنستخدمها للتعميم على المجتمع راجعًا للصدفة المحضة، لأن احتمال الحصول عليه مرتفع، أم نتيجة نادرة، احتمال الحصول عليها منخفض، وبالتالي تمثل نتيجة مميزة وليست اعتيادية. من هنا يمكنك فهم أهمية توزيع المعاينة في اختبار الفرضيات الإحصائية (2). 

مثالًا لكل العينات العشوائية الممكنة وأوساطها الحسابية، لنأخذ عينة حجمها 2 مع إرجاع من المجتمع التالي {2، 3، 4، 5}. عدد العينات العشوائية ذات الحجم 2 الممكنة يساوي 4x4 أي 16، وبما أن كل العينات لها نفس احتمال الحدوث، فاحتمال الحصول على أحد هذه العينات . والجدول التالي يوضح كل عينة ممكنة ووسطها الحسابي واحتمالها (2):

لنأخذ الوسط الحسابي 2 مثلًا، يمكن الحصول على هذا الوسط من العينة 2،2 فاحتمال الحصول على هذا الوسط الحسابي يساوي 116 ، أما الوسط الحسابي 2.5 فيمكن الحصول عليه من العينات 2،3 و 3،2 فاحتمال الحصول على هذا الوسط الحسابي يساوي  أي  وهكذا بقية الأوساط الحسابية الممكنة. والجدول التالي يمثل التوزيع الاحتمالي للأوساط الحسابية (2):

والمضلع التكراري لهذا التوزيع الاحتمالي كالتالي:

هل يبدو مألوفًا؟ 

ولكن عندما يكون حجم العينة كبيرًا ليس من العملي حساب كل الأوساط الحسابية الممكنة حتى باستخدام الحاسوب (2). لذلك تعد مبرهنة النهاية المركزية أحد أهم الأساسات في علم الإحصاء الحديث (1)، إذ تمكننا من معرفة شكل التوزيع الاحتمالي للأوساط الحسابية الممكنة، وبالتالي يمكننا معرفة احتمال الحصول على وسط حسابي ما من موقعه على شكل أو تمثيل التوزيع الاحتمالي (2). 

تقول مبرهنة النهاية المركزية أنه عند أخذ عينات عشوائية كبيرة كفاية مع إرجاع، من مجتمع إحصائي ذي وسط حسابي وانحراف معياري ،  فإن التوزيع الاحتمالي لأوساط هذه العينات يقترب من التوزيع الطبيعي (3). هذا صحيح بغض النظر عن نوع التوزيع الاحتمالي للمجتمع سواء كان طبيعيًا أو لا. و"عينة كبيرة كفاية" تعني أن عدد عناصر العينة أكبر من أو يساوي 30. 

بالنسبة إلى العينات العشوائية الممكنة المأخوذة من المجتمع فإن الوسط الحسابي لأوساطها الحسابية يساوي الوسط الحسابي للمجتمع  والانحراف المعياري لها يساوي  حيث n هو حجم العينة (3). المهم في هذا كله أنه يمكننا استخدام نموذج التوزيع الاحتمالي الطبيعي لتقييم اللايقين عند إجراء استدلال إحصائي عن الوسط الحسابي -المجهول عادةً- للمجتمع بناءً على الوسط الحسابي لعينةٍ ما (3). 

المصادر:

1. Kwak S,  Kim J. Central limit theorem: The cornerstone of modern statistics. Korean Journal of Anesthesiology[Internet]. 2017 April [cited 2022 Sep 30]; 70(2):144- 156. Available from: هنا

2. Witte RS, Witte JS. Statistics [Internet]. 11th ed. San Francisco: Wiley; 2017. 480 p. Available from: هنا

3. The role of probability [Internet]. Central Limit Theorem. Boston University School of Public Health; 2016 [cited 2022Dec7]. Available from: هنا