حساب وتفسير فترات الثقة، وعلاقتها باختبار الفرضيات وقيمة P

مقدمة

تُعدّ فترات الثقة (Confidence Intervals) واختبارات الفرضيات (Hypothesis Testing) وقيم P (P-values) من أهم الأدوات الإحصائية في الاستدلال الإحصائي. بينما تُقدّم فترات الثقة نطاقاً محتملاً للمعامل الحقيقي، تُقدّم اختبارات الفرضيات قراراً ثنائياً (رفض أو عدم رفض الفرضية الصفرية). يُظهر هذا المقال العلاقة العميقة بين هذه المفاهيم، وكيفية حسابها وتفسيرها بشكل صحيح، مع التحذير من الاستخدامات الخاطئة الشائعة.

الجزء الأول: مفهوم فترات الثقة

1.1 التعريف والفكرة الأساسية

فترة الثقة هي نطاق من القيم يُحتمل أن يحتوي على المعامل الحقيقي للمجتمع (Parameter) بناءً على بيانات العينة. على عكس التقدير النقطي (قيمة واحدة)، تُقدّم فترة الثقة معلومات عن الدقة والشك في التقدير.

التفسير الصحيح:

"إذا كررنا الدراسة 100 مرة، فإن 95 من فترات الثقة المحسوبة ستُحتوي على المعامل الحقيقي."

التفسير الخاطئ الشائع:

"هناك 95% احتمال أن يكون المعامل الحقيقي ضمن هذه الفترة." (❌ خطأ - المعامل ثابت، الفترة هي المتغيرة)

1.2 مستويات الثقة الشائعة

مستوى الثقة	قيمة Z (التوزيع الطبيعي)	قيمة t (df=30)	الاستخدام
90%	1.645	1.697	دراسات استكشافية، عينات كبيرة
95%	1.96	2.042	المعيار الأكثر شيوعاً
99%	2.576	2.750	دراسات سريرية حرجة، مخاطر عالية
99.9%	3.291	3.646	اكتشافات جديدة، تأكيدية

1.3 عوامل تأثير عرض فترة الثقة

العامل	العلاقة	التفسير
حجم العينة (n)	عكسية	زيادة n تُضيّق الفترة
مستوى الثقة	طردية	ثقة أعلى = فترة أوسع
التباين في البيانات (σ²)	طردية	تباين أكبر = فترة أوسع
حجم التأثير	-	تأثير أكبر = فترة أبعد عن الصفر

الجزء الثاني: حساب فترات الثقة

2.1 فترة ثقة للوسط الحسابي

عند معرفة الانحراف المعياري للمجتمع (σ):

CI = x̄ ± z_(α/2) × (σ/√n)

عند عدم معرفة الانحراف المعياري للمجتمع (استخدام s):

CI = x̄ ± t_(α/2, df) × (s/√n)

حيث:

x̄ = وسط العينة
z_(α/2) أو t_(α/2, df) = القيمة الحرجة
σ أو s = الانحراف المعياري (المجتمع أو العينة)
n = حجم العينة
df = n - 1 = درجات الحرية

مثال تطبيقي:

وسط عينة = 75، الانحراف المعياري s = 10، n = 25
مستوى الثقة 95% → t = 2.064 (df=24)
الخطأ المعياري = 10/√25 = 2
فترة الثقة: 75 ± (2.064 × 2) = (70.87, 79.13)

2.2 فترة ثقة للنسبة

CI = p̂ ± z_(α/2) × √[p̂(1-p̂)/n]

شروط التطبيق:

np̂ ≥ 10 و n(1-p̂) ≥ 10
العينة عشوائية

مثال تطبيقي:

نسبة النجاح = 120/200 = 0.60
n = 200، مستوى ثقة 95% → z = 1.96
الخطأ المعياري = √(0.60×0.40/200) = 0.0346
فترة الثقة: 0.60 ± (1.96 × 0.0346) = (0.532, 0.668) أو (53.2%, 66.8%)

2.3 فترة ثقة للفرق بين وسطين

لعينتين مستقلتين:

CI = (x̄₁ - x̄₂) ± t_(α/2, df) × √(s₁²/n₁ + s₂²/n₂)

لعينتين مرتبطتين (زوجيتين):

CI = d̄ ± t_(α/2, df) × (s_d/√n)

حيث d̄ هو متوسط الفروق

2.4 فترة ثقة لمعامل الارتباط

باستخدام تحويل Fisher's z:

z_r = 0.5 × ln[(1+r)/(1-r)]

CI_z = z_r ± z_(α/2) × √[1/(n-3)]

ثم تحويل الحدود العودة لـ r باستخدام:

r = (e^(2z) - 1) / (e^(2z) + 1)

2.5 فترة ثقة للانحدار

للميل (β₁):

CI = β̂₁ ± t_(α/2, n-2) × SE(β̂₁)

حيث:

SE(β̂₁) = √[MSE / Σ(xᵢ - x̄)²]

للتنبؤ بقيمة فردية:

CI = ŷ ± t_(α/2, n-2) × √[MSE × (1 + 1/n + (x₀-x̄)²/Σ(xᵢ-x̄)²)]

الجزء الثالث: اختبار الفرضيات

3.1 مكونات اختبار الفرضيات

المكون	الوصف	مثال
الفرضية الصفرية (H₀)	افتراض العدم أو المساواة	μ = μ₀، β = 0، لا فرق
الفرضية البديلة (H₁)	ما نريد إثباته	μ ≠ μ₀، β ≠ 0، يوجد فرق
مستوى المعنوية (α)	احتمال الخطأ من النوع الأول	0.05 (5%)، 0.01 (1%)
إحصائية الاختبار	القيمة المحسوبة من البيانات	t، z، F، χ²
قيمة P	احتمال الحصول على النتيجة أو أبعد	P < 0.05
القرار	رفض أو عدم رفض H₀	بناءً على المقارنة

3.2 أنواع الاختبارات

أ. حسب عدد الذيول:

النوع	H₁	الاستخدام	منطقة الرفض
ذيلتان (Two-tailed)	μ ≠ μ₀	اختبار وجود فرق (اتجاه غير معروف)	2.5% في كل طرف
ذيل واحد (One-tailed)	μ > μ₀ أو μ < μ₀	اختبار اتجاه محدد مسبقاً	5% في طرف واحد

ب. حسب عدد العينات:

النوع	التصميم	الاختبار
عينة واحدة	مقارنة مع قيمة معيارية	One-sample t-test
عينتان مستقلتان	مجموعتين مختلفتين	Independent t-test
عينتان مرتبطتان	قياس قبل-بعد	Paired t-test

3.3 خطوات اختبار الفرضيات

1. صياغة H₀ و H₁ ← تحديد الاتجاه (ذيل واحد/اثنان) 2. اختيار مستوى المعنوية α ← عادة 0.05 3. اختيار الاختبار المناسب ← t، z، F، إلخ 4. حساب إحصائية الاختبار ← من البيانات 5. تحديد قيمة P ← من الجداول أو البرامج 6. اتخاذ القرار: إذا P ≤ α ← رفض H₀ (النتيجة معنوية) إذا P > α ← عدم رفض H₀ (النتيجة غير معنوية) 7. التفسير العلمي ← في سياق المشكلة

الجزء الرابع: قيمة P والتفسيرات

4.1 تعريف قيمة P

التعريف الإحصائي:

قيمة P هي احتمال الحصول على نتيجة مثل التي شوهدت في العينة، أو أبعد منها، بافتراض أن الفرضية الصفرية صحيحة.

P = P(البيانات أو أبعد | H₀ صحيحة)

4.2 مقياس قوة الدلالة (Evidential Scale)

قيمة P	التفسير التقليدي	التفسير الحديث (ضعيف)
P < 0.001	شديدة المعنوية	دليل قوي ضد H₀
0.001 ≤ P < 0.01	معنوية جداً	دليل معتدل
0.01 ≤ P < 0.05	معنوية	دليل ضعيف
0.05 ≤ P < 0.10	حدودية	لا يوجد دليل كافٍ
P ≥ 0.10	غير معنوية	لا يوجد دليل

4.3 الأخطاء الشائعة في تفسير قيمة P

الخطأ	التصحيح
"P = 0.03 يعني 97% احتمال أن H₀ خاطئة"	P ليست احتمال صحة H₀
"P = 0.04 معنوية، P = 0.06 غير معنوية"	الفرق طفيف، لا يعني تغيراً جوهرياً
"P < 0.05 تعني أهمية عملية"	المعنوية الإحصائية ≠ الأهمية العملية
"P > 0.05 تعني عدم وجود تأثير"	قد يكون التأثير موجوداً لكن صغيراً
"البحث مع P = 0.001 أفضل من P = 0.04"	P تعتمد على حجم العينة أيضاً

الجزء الخامس: العلاقة بين فترات الثقة واختبار الفرضيات

5.1 التكافؤ الرياضي

المبدأ الأساسي:

إذا كانت قيمة المعلم المفحوص في H₀ (مثلاً μ₀) تقع خارج فترة الثقة (1-α)٪، فإن اختبار الفرضيات عند مستوى α سيرفض H₀.

العلاقة العكسية:

فترة ثقة 95% ↔ اختبار عند α = 0.05 (ذيلتان)
فترة ثقة 99% ↔ اختبار عند α = 0.01 (ذيلتان)

5.2 مثال توضيحي

البيانات:

وسط عينة = 105، μ₀ = 100 (في H₀)
s = 15، n = 36
مستوى الثقة 95%، α = 0.05

الحساب:

الخطأ المعياري = 15/√36 = 2.5
t = (105-100)/2.5 = 2.0
فترة الثقة: 105 ± (2.03 × 2.5) = (99.9, 110.1)
df = 35، P-value (ذيلتان) = 0.053

النتيجة:

فترة الثقة 95% تتضمن 100 → عدم رفض H₀
P = 0.053 > 0.05 → عدم رفض H₀
التكافؤ: النتيجتان متطابقتان

5.3 متى تُستخدم كل أداة؟

الأداة	الأفضلية	الاستخدام الأمثل
فترة الثقة	تُقدم معلومات عن الحجم والدقة	التقدير، التنبؤ، المقارنات
قيمة P	بساطة القرار الثنائي	الاختبار السريع، الفحص الأولي
الحجم التأثير + CI	أهمية عملية + دقة	التقرير النهائي، اتخاذ القرار

الجزء السادس: حجم التأثير والقوة الإحصائية

6.1 حجم التأثير (Effect Size)

التعريف:

قياس مغناطيسي للفرق أو العلاقة، مستقل عن حجم العينة.

أنواع أحجام التأثير:

النوع	المعادلة	التفسير الصغير/المتوسط/الكبير
Cohen's d	(x̄₁ - x̄₂)/s_pooled	0.2 / 0.5 / 0.8
Pearson's r	معامل الارتباط	0.1 / 0.3 / 0.5
R²	معامل التحديد	0.01 / 0.09 / 0.25
Odds Ratio	ad/bc	1.5 / 2.5 / 4.0
Eta squared (η²)	SS_between/SS_total	0.01 / 0.06 / 0.14

6.2 القوة الإحصائية (Statistical Power)

التعريف:

احتمال رفض H₀ بشكل صحيح عندما تكون خاطئة فعلاً (1 - β).

المستوى المقبول:

Power ≥ 0.80 (80%)

عوامل تأثير القوة:

العامل	العلاقة	التوصية
حجم العينة (n)	طردية	زيادة n لزيادة القوة
حجم التأثير (ES)	طردية	تصميم الدراسة لاكتشاف ES معقول
مستوى المعنوية (α)	طردية	α أكبر = قوة أكبر (لكن خطأ أكبر)
التباين	عكسية	تقليل الضوضاء، زيادة الدقة

حساب حجم العينة:

n = [(z_(α/2) + z_β)² × σ²] / ES²

الجزء السابع: التطبيقات العملية والأمثلة

مثال 1: دراسة سريرية

السياق:

اختبار فعالية دواء جديد في خفض ضغط الدم

البيانات:

المجموعة العلاجية: n=50، mean=135 mmHg، SD=10
المجموعة الضابطة: n=50، mean=145 mmHg، SD=12

الحسابات:

الفرق = -10 mmHg
SE = √(10²/50 + 12²/50) = 2.21
95% CI: -10 ± (1.96 × 2.21) = (-14.3, -5.7)
z = -10/2.21 = -4.52، P < 0.001
Cohen's d = 10/11 = 0.91 (حجم تأثير كبير)

التفسير:

الفترة لا تتضمن الصفر → رفض H₀
الدواء يُخفض ضغط الدم بمعدل 5.7-14.3 mmHg
التأثير كبير ومؤكد إحصائياً

مثال 2: دراسة استطلاع رأي

السياق:

تقدير نسبة الموافقة على سياسة عامة

البيانات:

n = 1000، نسبة الموافقة = 52%

الحسابات:

SE = √(0.52×0.48/1000) = 0.0158
95% CI: 0.52 ± (1.96 × 0.0158) = (0.489, 0.551) أو (48.9%, 55.1%)

التفسير:

الفترة تتضمن 50% → لا يمكن الجزم بأن الأغلبية توافق
النتيجة حدودية، يحتاج لعينة أكبر للتأكد

مثال 3: تحليل انحدار

السياق:

دراسة علاقة التدريب بالأداء الوظيفي

البيانات:

n = 100، الميل = 0.8، SE = 0.3

الحسابات:

95% CI للميل: 0.8 ± (1.98 × 0.3) = (0.21, 1.39)
t = 0.8/0.3 = 2.67، P = 0.009

التفسير:

الفترة لا تتضمن الصفر → العلاقة معنوية
كل ساعة تدريب تزيد الأداء بـ 0.21-1.39 نقطة
التأثير إيجابي لكن مداه واسع (دقة متوسطة)

الجزء الثامن: التوصيات والممارسات الجيدة

8.1 ماذا نُبلغ؟ (APA Recommendations)

الحد الأدنى:

حجم التأثير مع فترة الثقة
قيمة P (أو أفضل: الإحصائية الدقيقة)
حجم العينة

الصيغة المثلى:

"كان التأثير معنوياً (M = 25.3، 95% CI [22.1, 28.5]، d = 0.72، P < 0.001، n = 150)"

8.2 ما نتجنبه

الممارسة السيئة	البديل الجيد
"P = 0.03 < 0.05 معنوي"	"الفرق 3.2 نقطة (95% CI: 0.5, 5.9)"
"غير معنوي (P = 0.08)"	"لم نجد دليلاً كافياً (P = 0.08، 95% CI: -0.2, 4.8)"
"P = 0.000"	"P < 0.001"
الاقتصار على P	تقديم CI، حجم التأثير، والسياق

8.3 التحول نحو الاستدلال التقديري

النقد الحديث للاختبارات التقليدية:

التركيز المفرط على P = 0.05 كحد سحري
إهمال حجم التأثير والدقة
مشكلة التكرار المتعدد (Multiple Comparisons)

البديل: الاستدلال التقديري (Estimation Statistics):

التركيز على فترات الثقة كأداة أساسية
تقديم أحجام التأثير مع تفسيرها العملي
استخدام رسوم بيانية للفترات (Cumming, 2012)

الخاتمة

تُشكّل فترات الثقة واختبارات الفرضيات وقيم P أدوات مكمّلة في الاستدلال الإحصائي. بينما تُقدّم اختبارات الفرضيات إجابة ثنائية (نعم/لا)، تُقدّم فترات الثقة معلومات غنية عن مقدار التأثير ودقة تقديره. إن الفهم العميق للعلاقة بين هذه المفاهيم، وتجنب التفسيرات الخاطئة الشائعة، يُحسّن جودة البحث العلمي ويُسهّل اتخاذ القرارات المبنية على الأدلة.

المراجع

"Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis" - Geoff Cumming (2012)
"The American Statistician: Statistical Inference in the 21st Century" - Wasserstein & Lazar (2016)
"Statistics Done Wrong: The Woefully Complete Guide" - Alex Reinhart (2015)
"What is a p-value anyway? 34 Stories to Help You Actually Understand Statistics" - Andrew Vickers (2010)
"The ASA's Statement on p-Values: Context, Process, and Purpose" - Wasserstein & Lazar (2016), The American Statistician
"Moving to a World Beyond 'p < 0.05'" - Wasserstein, Schirm & Lazar (2019)

أقسام الوصول السريع (مربع البحث)

حساب وتفسير فترات الثقة، وعلاقتها باختبار الفرضيات وقيمة P

مقدمة

الجزء الأول: مفهوم فترات الثقة

1.1 التعريف والفكرة الأساسية

التفسير الصحيح:

التفسير الخاطئ الشائع:

1.2 مستويات الثقة الشائعة

1.3 عوامل تأثير عرض فترة الثقة

الجزء الثاني: حساب فترات الثقة

2.1 فترة ثقة للوسط الحسابي

عند معرفة الانحراف المعياري للمجتمع (σ):

عند عدم معرفة الانحراف المعياري للمجتمع (استخدام s):

مثال تطبيقي:

2.2 فترة ثقة للنسبة

شروط التطبيق:

مثال تطبيقي:

2.3 فترة ثقة للفرق بين وسطين

لعينتين مستقلتين:

لعينتين مرتبطتين (زوجيتين):

2.4 فترة ثقة لمعامل الارتباط

باستخدام تحويل Fisher's z:

2.5 فترة ثقة للانحدار

للميل (β₁):

للتنبؤ بقيمة فردية:

الجزء الثالث: اختبار الفرضيات

3.1 مكونات اختبار الفرضيات

3.2 أنواع الاختبارات

أ. حسب عدد الذيول:

ب. حسب عدد العينات:

3.3 خطوات اختبار الفرضيات

الجزء الرابع: قيمة P والتفسيرات

4.1 تعريف قيمة P

التعريف الإحصائي:

4.2 مقياس قوة الدلالة (Evidential Scale)

4.3 الأخطاء الشائعة في تفسير قيمة P

الجزء الخامس: العلاقة بين فترات الثقة واختبار الفرضيات

5.1 التكافؤ الرياضي

المبدأ الأساسي:

العلاقة العكسية:

5.2 مثال توضيحي

البيانات:

الحساب:

النتيجة:

5.3 متى تُستخدم كل أداة؟

الجزء السادس: حجم التأثير والقوة الإحصائية

6.1 حجم التأثير (Effect Size)

التعريف:

أنواع أحجام التأثير:

6.2 القوة الإحصائية (Statistical Power)

التعريف:

المستوى المقبول:

عوامل تأثير القوة:

حساب حجم العينة:

الجزء السابع: التطبيقات العملية والأمثلة

مثال 1: دراسة سريرية

السياق:

البيانات:

الحسابات:

التفسير:

مثال 2: دراسة استطلاع رأي

السياق:

البيانات:

الحسابات:

التفسير:

مثال 3: تحليل انحدار

السياق:

البيانات:

الحسابات:

التفسير:

الجزء الثامن: التوصيات والممارسات الجيدة

8.1 ماذا نُبلغ؟ (APA Recommendations)

الحد الأدنى:

الصيغة المثلى:

8.2 ما نتجنبه

8.3 التحول نحو الاستدلال التقديري

النقد الحديث للاختبارات التقليدية:

البديل: الاستدلال التقديري (Estimation Statistics):

الخاتمة

المراجع