اختبار مربع تشي في Excel | كيفية القيام باختبار مربع تشي بالمثال
اختبار Chi-Square مع Excel
يعتبر اختبار Chi-Square في Excel هو الاختبار غير المعياري الأكثر استخدامًا والمستخدم لمقارنة متغيرين أو أكثر للبيانات المختارة عشوائيًا. إنه نوع من الاختبار يستخدم لاكتشاف العلاقة بين متغيرين أو أكثر ، ويستخدم هذا في الإحصائيات التي تُعرف أيضًا باسم Chi-Square P-value ، في Excel ليس لدينا وظيفة مضمنة ولكن يمكننا استخدامها الصيغ لإجراء اختبار خي مربع في التفوق باستخدام الصيغة الرياضية لاختبار كاي سكوير.
أنواع
- اختبار Chi-Square لصلاحية الملاءمة
- اختبار Chi-Square لاستقلال متغيرين.
# 1 - اختبار Chi-Square لجودة الملاءمة
يتم استخدامه لإدراك قرب العينة التي تناسب السكان. رمز اختبار Chi-Square هو (2). إنه مجموع كل ( العدد المرصود - العدد المتوقع) 2 / العدد المتوقع.
- حيث k-1 درجات الحرية أو DF.
- حيث Oi هو التردد المرصود ، k فئات ، و E هو التردد المتوقع.
ملاحظة: - تشير جودة ملاءمة النموذج الإحصائي إلى فهم مدى ملاءمة بيانات العينة لمجموعة من الملاحظات.
الاستخدامات
- الجدارة الائتمانية للمقترضين على أساس الفئات العمرية والقروض الشخصية
- العلاقة بين أداء الباعة والتدريب المتلقاة
- العائد على سهم واحد وعلى أسهم قطاع مثل الأدوية أو البنوك
- فئة المشاهدين وتأثير الحملة التلفزيونية.
# 2 - اختبار Chi-Square لاستقلال متغيرين
يتم استخدامه للتحقق مما إذا كانت المتغيرات مستقلة عن بعضها البعض أم لا. مع (r-1) (c-1) درجات الحرية
حيث Oi هو التردد الملحوظ ، r هو عدد الصفوف ، c هو عدد الأعمدة ، و E هو التردد المتوقع
ملاحظة: - يطلق على متغيرين عشوائيين مستقلين إذا كان التوزيع الاحتمالي لأحد المتغيرات لا يتأثر بالمتغير الآخر.الاستخدامات
اختبار الاستقلال مناسب للحالات التالية:
- هناك متغير فئوي واحد.
- هناك نوعان من المتغيرات الفئوية ، وسوف تحتاج إلى تحديد العلاقة بينهما.
- هناك جداول متقاطعة ، ويجب إيجاد العلاقة بين متغيرين فئويين.
- هناك متغيرات غير قابلة للقياس الكمي (على سبيل المثال ، إجابات لأسئلة مثل ، هل يختار الموظفون في مختلف الفئات العمرية أنواعًا مختلفة من الخطط الصحية؟)
كيفية القيام باختبار Chi-Square في Excel؟ (مع مثال)
يمكنك تنزيل قالب Excel لاختبار مربع Chi هذا من هنا - قالب Excel لاختبار مربع Chiيريد مدير المطعم إيجاد العلاقة بين رضا العملاء ورواتب الأشخاص المنتظرين للطاولات. في هذا ، سنضع الفرضية لاختبار Chi-Square
- أخذت عينة عشوائية من 100 عميل يسألون عما إذا كانت الخدمة ممتازة أم جيدة أم سيئة.
- ثم تصنف رواتب المنتظرين بأنها منخفضة ومتوسطة وعالية.
- افترض أن مستوى الأهمية هو 0.05. هنا ، تشير H0 و H1 إلى استقلالية جودة الخدمة واعتمادها على رواتب طاولات الانتظار.
- ح 0 - جودة الخدمة لا تعتمد على رواتب المنتظرين للطاولات.
- ح 1 - جودة الخدمة تعتمد على رواتب المنتظرين للطاولات
- النتائج التي توصلت إليها موضحة في الجدول أدناه:
في هذا ، لدينا 9 نقاط بيانات لدينا 3 مجموعات لكل منها رسالة مختلفة حول الراتب والنتيجة معطاة أدناه.
سنقوم الآن بحساب مجموع كل الصفوف والأعمدة. سنفعل ذلك بمساعدة الصيغة مثل SUM. لإجمالي ممتاز في عمود الإجمالي ، كتبنا = SUM (B4: D4) ثم اضغط على إدخال.
هذا سيعطينا 26 . سنفعل الشيء نفسه مع جميع الصفوف والأعمدة.
لحساب درجة الحرية (DF) نستخدم (r-1) (c-1)
DF = (3-1) (3-1) = 2 * 2 = 4
- هناك 3 فئات للخدمة و 3 فئات للراتب
- لدينا 27 مستجيبًا براتب متوسط (الصف السفلي ، الوسط)
- لدينا 51 مستجيبًا لديهم خدمة جيدة (العمود الأخير ، في المنتصف)
الآن علينا حساب الترددات المتوقعة: -
يمكن حساب التكرارات المتوقعة باستخدام معادلة: -
- لحساب الامتياز سنستخدم ضرب إجمالي منخفض بإجمالي ممتاز مقسومًا على N.
لنفترض أنه يتعين علينا حساب الصف الأول والعمود الأول (= B7 * E4 / B9 ) . سيعطي هذا العدد المتوقع للعملاء الذين صوتوا خدمة ممتازة لرواتب الأشخاص المنتظرين منخفضة أي 8.32 .
- E 11 = (32 * 26) / 100 = 8.32 ، E 12 = 7.02 ، E 13 = 10.66
- ه 21 = 16.32 ، ه 22 = 13.77 ، ه 23 = 20.91
- E 31 = 7.36 ، E 32 = 6.21 ، E 33 = 9.41
وبالمثل بالنسبة للجميع ، علينا أن نفعل الشيء نفسه ويتم تطبيق الصيغة في الرسم البياني أدناه.
نحصل على جدول التردد المتوقع كما هو موضح أدناه: -
ملاحظة: - افترض أن مستوى الأهمية 0.05. هنا ، تشير H0 و H1 إلى استقلالية جودة الخدمة واعتمادها على رواتب طاولات الانتظار.
بعد حساب التردد المتوقع ، سنحسب نقاط بيانات مربع كاي باستخدام صيغة
نقاط Chi-Square = (ملحوظة - متوقعة) ^ 2 / متوقع
لحساب النقطة الأولى نكتب = (B4-B14) ^ 2 / B14.
سنقوم بنسخ ولصق الصيغة في خلايا أخرى لملء القيمة تلقائيًا.
بعد ذلك ، سنقوم بحساب قيمة chi (القيمة المحسوبة) عن طريق إضافة جميع القيم الواردة أعلى الجدول
حصلنا على قيمة Chi كـ 18.65823 .
لحساب القيمة الحرجة لهذا ، نستخدم جدول القيمة الحرجة لـ chi-square حيث يمكننا استخدام الصيغة الواردة أدناه.
تحتوي هذه الصيغة على معلمتين CHISQ.INV.RT (الاحتمال ، درجة الحرية).
الاحتمال هو 0.05 ، إنها قيمة مهمة ستساعدنا على تحديد ما إذا كنا سنقبل فرضية Null (H 0 ) أم لا.
القيمة الحرجة لمربع كاي هي 9.487729037.
سنجد الآن قيمة مربع كاي أو (قيمة P) = CHITEST ( النطاق الفعلي ، النطاق المتوقع)
المدى من = CHITEST (B4: D6، B14: D16) .
كما رأينا أن قيمة اختبار تشي أو قيمة P تساوي 0.00091723.
كما رأينا أننا قمنا بحساب جميع القيم. تكون قيم chi-square (القيمة المحسوبة) مهمة فقط عندما تكون قيمتها مساوية للقيمة الحرجة 9.48 أو أكثر منها ، أي يجب أن تكون القيمة الحرجة (القيمة المجدولة) أعلى من 18.65 لقبول فرضية Null (H 0 ) .
لكن هنا القيمة المحسوبة > القيمة المجدولة
X2 (محسوبة)> X2 (مجدولة)
18.65> 9.48
في هذه الحالة، فإننا سوف ترفض خالية الفرضية (H 0 ) و البديل (H 1 ) سوف يكون مقبولا.
- يمكننا أيضًا استخدام P-Value للتنبؤ بنفس الشيء ، أي إذا كانت القيمة P <= α (قيمة كبيرة 0.05) ، فسيتم رفض فرضية Null
- إذا كانت القيمة P> α ، فلا ترفض فرضية العدم .
هنا قيمة P (0.0009172) < α (0.05) ، رفض H 0 ، قبول H 1
من المثال أعلاه ، نستنتج أن جودة الخدمة تعتمد على رواتب المنتظرين.
أشياء للذكرى
- يعتبر مربع المتغير العادي القياسي.
- يقيِّم ما إذا كانت الترددات الملاحظة في فئات مختلفة تختلف اختلافًا كبيرًا عن الترددات المتوقعة وفقًا لمجموعة محددة من الافتراضات.
- يحدد مدى ملاءمة التوزيع المفترض للبيانات.
- يستخدم جداول الطوارئ (في أبحاث السوق ، تسمى هذه الجداول علامات التبويب المتقاطعة).
- يدعم قياسات المستوى الاسمي.