اختبارات الفروض للمتوسطات والنسب: اختبار T ومربع كاي
مقدمة
تُعدّ اختبارات الفروض الإحصائية (Hypothesis Tests) من أهم أدوات الاستدلال الإحصائي، إذ تُمكّن الباحثين من اتخاذ قرارات مبنية على البيانات العينية حول المجتمعات الإحصائية. يُركّز هذا المقال على اختبارين أساسيين: اختبار T (T-Test) للمتوسطات، واختبار مربع كاي (Chi-Square Test) للنسب والتكرارات، مع التطبيقات العملية والشروط والقيود.
الجزء الأول: اختبار T للمتوسطات (T-Test)
1.1 مفهوم اختبار T
يُستخدم اختبار T للمقارنة بين متوسطات مجموعات، عندما يكون الانحراف المعياري للمجتمع غير معروف ونستخدم بدلاً منه انحراف العينة. طوره ويليام غوسيت (Student) عام 1908.
الفرق بين Z و T:
| المعيار | اختبار Z | اختبار T |
|---|---|---|
| معرفة σ | نعم | لا |
| حجم العينة | كبير (n > 30) | صغير أو كبير |
| التوزيع | طبيعي | t-Student |
| درجات الحرية | غير محدودة | df = n - 1 |
1.2 أنواع اختبار T
| النوع | التصميم | المعادلة | درجات الحرية |
|---|---|---|---|
| عينة واحدة | مقارنة مع قيمة معيارية | t = (x̄ - μ₀) / (s/√n) | n - 1 |
| عينتان مستقلتان | مجموعتين مختلفتين | t = (x̄₁ - x̄₂) / √[s_p²(1/n₁ + 1/n₂)] | n₁ + n₂ - 2 |
| عينتان مرتبطتان | قياس قبل-بعد | t = d̄ / (s_d/√n) | n - 1 |
1.3 اختبار T لعينة واحدة (One-Sample T-Test)
الاستخدام:
مقارنة وسط عينة بقيمة معيارية معروفة أو مفترضة.
الفرضيات:
- H₀: μ = μ₀ (الوسط يساوي القيمة المعيارية)
- H₁: μ ≠ μ₀ (الوسط لا يساوي) — أو μ > μ₀ أو μ < μ₀
المعادلة:
مثال تطبيقي:
- متوسط IQ لعينة طلاب = 108
- المتوسط المعياري للمجتمع = 100
- الانحراف المعياري s = 15، n = 25
- t = (108-100) / (15/√25) = 8/3 = 2.67
- df = 24، P-value (ذيلتان) = 0.013
- النتيجة: رفض H₀، الطلاب أعلى IQ من المتوسط
1.4 اختبار T لعينتين مستقلتين (Independent Samples T-Test)
الاستخدام:
مقارنة وسطي مجموعتين مختلفتين (عشوائية).
أنواع الاختبار:
| النوع | متى نستخدمه | المعادلة |
|---|---|---|
| Pooled (متساوي التباين) | s₁² ≈ s₂² | s_p² = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2) |
| Welch's (غير متساوي التباين) | s₁² ≠ s₂² | df مُعدلة |
اختبار Levene لمساواة التباينات:
- H₀: σ₁² = σ₂²
- إذا P > 0.05 → استخدام Pooled
- إذا P ≤ 0.05 → استخدام Welch's
مثال تطبيقي:
- مجموعة علاج: mean = 75، s = 10، n = 30
- مجموعة ضابطة: mean = 68، s = 12، n = 30
- Levene's test: P = 0.34 → متساوي التباين
- s_p² = [29(100) + 29(144)] / 58 = 122
- t = (75-68) / √[122(1/30 + 1/30)] = 7/2.85 = 2.46
- df = 58، P = 0.017 → رفض H₀
1.5 اختبار T لعينتين مرتبطتين (Paired Samples T-Test)
الاستخدام:
مقارنة قياسين للنفس الأفراد (قبل-بعد، زوجي).
المعادلة:
حيث d̄ هو متوسط الفروق الفردية.
مثال تطبيقي:
- قياس ضغط دم 20 مريضاً قبل وبعد العلاج
- متوسط الفرق = -15 mmHg (انخفاض)
- انحراف الفروق = 8 mmHg
- t = -15 / (8/√20) = -8.39
- df = 19، P < 0.001 → رفض H₀، العلاج فعّال
1.6 افتراضات اختبار T
| الافتراض | طريقة الفحص | الحل إذا انتهك |
|---|---|---|
| التوزيع الطبيعي | Shapiro-Wilk test، Q-Q plot | تحويل البيانات، أو Mann-Whitney U |
| التباين المتساوي | Levene's test، F-max | Welch's t-test (لا يحتاج تساوي التباين) |
| الاستقلال | تصميم الدراسة | نماذج متعددة المستويات |
| المستوى الفاصل | نوع المتغير | Mann-Whitney U للترتيبي |
1.7 حجم التأثير لاختبار T
| المقياس | المعادلة | التفسير |
|---|---|---|
| Cohen's d | (x̄₁ - x̄₂) / s_pooled | 0.2=صغير، 0.5=متوسط، 0.8=كبير |
| r² | t² / (t² + df) | نسبة التباين المفسر |
| Hedges' g | تعديل لعينات صغيرة | أكثر دقة من d لـ n < 20 |
الجزء الثاني: اختبار مربع كاي (Chi-Square Test)
2.1 مفهوم اختبار مربع كاي
يُستخدم اختبار مربع كاي (χ²) للمتغيرات النوعية (Categorical)، لاختبار:
- الاستقلال: هل متغيران مستقلان؟
- الملاءمة: هل التوزيع الملاحظ يطابق التوزيع المتوقع؟
- التجانس: هل التوزيعات متجانسة عبر مجموعات؟
طوره كارل بيرسون عام 1900.
2.2 أنواع اختبار مربع كاي
| النوع | الاستخدام | المعادلة |
|---|---|---|
| الاستقلال (Independence) | جدول التقاطع r×c | χ² = Σ[(Oᵢⱼ - Eᵢⱼ)² / Eᵢⱼ] |
| الملاءمة (Goodness of Fit) | مطابقة توزيع نظري | χ² = Σ[(Oᵢ - Eᵢ)² / Eᵢ] |
| McNemar | عينتان مرتبطتان ثنائيتان | χ² = (b-c)² / (b+c) |
2.3 اختبار استقلال مربع كاي (Chi-Square Test of Independence)
الاستخدام:
دراسة العلاقة بين متغيرين نوعيين في جدول تقاطع.
الفرضيات:
- H₀: المتغيران مستقلان (لا علاقة)
- H₁: المتغيران غير مستقلان (توجد علاقة)
المعادلة:
حيث:
- Oᵢⱼ = التكرار الملاحظ
- Eᵢⱼ = (Row Total × Column Total) / Grand Total
درجات الحرية:
مثال تطبيقي:
دراسة العلاقة بين التدخين (نعم/لا) وسرطان الرئة (نعم/لا)
| سرطان+ | سرطان- | المجموع | |
|---|---|---|---|
| مدخن | 60 (O) | 40 | 100 |
| غير مدخن | 20 (O) | 80 | 100 |
| المجموع | 80 | 120 | 200 |
- E₁₁ = (100 × 80) / 200 = 40
- χ² = (60-40)²/40 + (40-60)²/60 + (20-40)²/40 + (80-60)²/60 = 33.33
- df = 1، P < 0.001 → رفض H₀، توجد علاقة
2.4 اختبار ملاءمة مربع كاي (Goodness of Fit Test)
الاستخدام:
مقارنة توزيع عينة مع توزيع نظري أو معروف.
مثال تطبيقي:
هل توزيع الطلاب على التخصصات (علمي/أدبي/تجاري) متساوٍ؟
- البيانات: علمي=120، أدبي=80، تجاري=50 (الكلي=250)
- التوقع المتساوي: 83.3 لكل تخصص
- χ² = (120-83.3)²/83.3 + (80-83.3)²/83.3 + (50-83.3)²/83.3 = 29.6
- df = 2، P < 0.001 → رفض H₀، التوزيع غير متساوٍ
2.5 مربع كاي لجداول 2×2: التصحيحات
| الحالة | التصحيح | متى نستخدمه |
|---|---|---|
| n ≥ 40 و E ≥ 5 | بدون تصحيح | الاختبار القياسي |
| n ≥ 40 و 1 ≤ E < 5 | Yates' Continuity Correction | χ² = Σ[(|O-E|-0.5)² / E] |
| n < 40 أو E < 1 | اختبار Fisher's Exact | حساب الاحتمالات المباشرة |
2.6 اختبار McNemar للعينات المرتبطة
الاستخدام:
مقارنة نسبتين متناسبتين (Before-After) لنفس الأفراد.
الجدول:
| After: نعم | After: لا | المجموع | |
|---|---|---|---|
| Before: نعم | a | b | a+b |
| Before: لا | c | d | c+d |
المعادلة:
مثال:
هل برنامج الإقلاع عن التدخين فعّال؟
- a=30 (استمر)، b=20 (أقلع)، c=10 (بدأ)، d=40 (لم يدخن)
- χ² = (20-10)² / 30 = 3.33
- df = 1، P = 0.068 → حدودي
2.7 افتراضات اختبار مربع كاي
| الافتراض | الشرط | الحل إذا انتهك |
|---|---|---|
| البيانات النوعية | المتغيرات فئوية | استخدام اختبارات أخرى |
| الاستقلال | المشاهدات مستقلة | نماذج مرتبطة |
| حجم العينة الكافي | E ≥ 5 لـ 80% من الخلايا | Fisher's Exact أو دمج فئات |
| الاكتمال | جميع الفئات ممثلة | التأكد من عدم فقدان بيانات |
2.8 مقاييس القوة العلائقية
| المقياس | الاستخدام | التفسير |
|---|---|---|
| Phi (φ) | جداول 2×2 | 0.1=صغير، 0.3=متوسط، 0.5=كبير |
| Cramer's V | جداول r×c | مثل Phi، مُعدل لحجم الجدول |
| Contingency Coefficient | أي جدول | أقل استخداماً، يميل للتقليل |
| Odds Ratio (OR) | جداول 2×2 | تفسير سريري/عملي |
حساب Phi:
حساب Cramer's V:
الجزء الثالث: مقارنة بين الاختبارين واختيار الأنسب
3.1 خريطة اختيار الاختبار
3.2 مقارنة شاملة
| المعيار | اختبار T | مربع كاي |
|---|---|---|
| نوع البيانات | كمية مستمرة | نوعية فئوية |
| المعلم | المتوسط (μ) | النسب/التكرارات |
| التوزيع | t-Student | Chi-Square |
| حجم العينة | مرن (n ≥ 30 مثالي) | يحتاج n كبير (E ≥ 5) |
| القوة التمييزية | عالية | متوسطة إلى عالية |
| المعلومات المفقودة | يمكن معالجتها | مشكلة أكبر |
3.3 البدائل غير المعاملية (Non-parametric)
| الاختبار المعاملي | البديل غير المعاملي | متى نستخدم البديل |
|---|---|---|
| One-sample t | One-sample Wilcoxon | البيانات شديدة الانحراف |
| Independent t | Mann-Whitney U | عدم التوازن، شواذ |
| Paired t | Wilcoxon Signed-Rank | الفروق غير طبيعية |
| χ² Independence | Fisher's Exact | n صغير، E < 5 |
الجزء الرابع: التطبيقات العملية والأمثلة المكاملة
مثال 1: دراسة فعالية برنامج تدريبي
السياق:
مقارنة أداء موظفين قبل وبعد التدريب
البيانات:
| الموظف | قبل | بعد | الفرق |
|---|---|---|---|
| 1 | 65 | 75 | +10 |
| 2 | 70 | 72 | +2 |
| ... | ... | ... | ... |
| 25 | 68 | 80 | +12 |
التحليل:
- d̄ = 8.4، s_d = 4.2
- Paired t-test: t = 8.4 / (4.2/√25) = 10.0
- df = 24، P < 0.001، d = 2.0 (تأثير كبير جداً)
- الاستنتاج: التدريب فعّال إحصائياً وعملياً
مثال 2: دراسة العلاقة بين الجنس والتخصص
السياق:
هل توجد علاقة بين الجنس والاختيار بين الطب والهندسة؟
البيانات:
| طب | هندسة | المجموع | |
|---|---|---|---|
| ذكور | 40 | 60 | 100 |
| إناث | 70 | 30 | 100 |
| المجموع | 110 | 90 | 200 |
التحليل:
- χ² = 18.18، df = 1، P < 0.001
- Cramer's V = 0.30 (علاقة متوسطة)
- الاستنتاج: توجد علاقة معنوية؛ الإناث يميلون للطب أكثر
مثال 3: مقارنة ثلاثة علاجات
السياق:
مقارنة فعالية ثلاثة أدوية لخفض الضغط
البيانات:
| الدواء | n | Mean | SD |
|---|---|---|---|
| A | 30 | 140 | 10 |
| B | 30 | 135 | 12 |
| C | 30 | 145 | 8 |
الملاحظة:
ثلاث مجموعات → لا يمكن استخدام t-test مباشرة
الحل:
- ANOVA أولاً: F = 5.2، P = 0.008 → فروق معنوية
- Post-hoc t-tests مع تصحيح Bonferroni:
- A vs B: P = 0.042 (معنوي)
- A vs C: P = 0.318 (غير معنوي)
- B vs C: P = 0.001 (معنوي)
الجزء الخامس: الأخطاء الشائعة والتحذيرات
5.1 أخطاء في استخدام اختبار T
| الخطأ | التوضيح | الحل |
|---|---|---|
| عدم فحص التباين | افتراض التساوي دون اختبار | استخدام Levene's test أولاً |
| تجاهل حجم التأثير | الاكتفاء بالمعنوية | حساب Cohen's d دائماً |
| اختبارات متعددة | مقارنات زوجية كثيرة | ANOVA + post-hoc |
| الانحراف عن الطبيعية | استخدام T للبيانات المنحرفة | التحويل أو Mann-Whitney |
| عينات صغيرة جداً | n < 10 | زيادة العينة أو bootstrap |
5.2 أخطاء في استخدام مربع كاي
| الخطأ | التوضيح | الحل |
|---|---|---|
| خلايا صغيرة | E < 5 في كثير من الخلايا | Fisher's Exact أو دمج فئات |
| البيانات المستمرة | تقسيم متغير كمي لفئات | استخدام correlation أو regression |
| الاتجاه السببي | الاستنتاج بالسببية من الارتباط | التصميم التجريبي |
| العينات المرتبطة | استخدام χ² العادي | McNemar أو Cochran's Q |
| الاستنتاج بالعدم | P > 0.05 يعني "لا علاقة" | "لا يوجد دليل كافٍ" |
5.3 مشكلة القيم المتعددة (Multiple Comparisons)
المشكلة:
إجراء 20 اختباراً عند α = 0.05 يُنتج قيمة P < 0.05 واحدة بالصدفة.
الحلول:
| الطريقة | الاستخدام | التصحيح |
|---|---|---|
| Bonferroni | اختبارات قليلة | α' = α/k |
| Holm-Bonferroni | أكثر قوة | ترتيب القيم تصاعدياً |
| False Discovery Rate | اختبارات كثيرة (جينوم) | Benjamini-Hochberg |
| Tukey HSD | مقارنات جماعية بعد ANOVA | تصحيح خاص |
الخاتمة
يُشكّل اختبار T ومربع كاي حجر الزاوية في الاختبارات الإحصائية للمتوسطات والنسب. إن اختيار الاختبار المناسب يعتمد على:
- نوع البيانات (كمية vs نوعية)
- تصميم الدراسة (عينة واحدة، مستقلة، مرتبطة)
- الافتراضات (التوزيع، التباين، حجم العينة)
إن الفهم العميق لهذه الاختبارات، مع الالتزام بالشروط والتحذيرات، يضمن استنتاجات صحيحة وموثوقة في البحث العلمي.
المراجع
- "Biostatistics: The Bare Essentials" - Norman & Streiner (3rd ed.)
- "Statistical Methods for the Social Sciences" - Alan Agresti & Barbara Finlay
- "Practical Statistics for Medical Research" - Douglas G. Altman
- "Nonparametric Statistical Methods" - Hollander, Wolfe & Chicken
- "The Analysis of Contingency Tables" - Brian S. Everitt (2nd ed.)
- "Effect Sizes for Research" - Grissom & Kim (2nd ed.)
