يتم استخدام الإحصاء الوصفي لوصف السمات الأساسية للبيانات
في الدراسة. أنها
توفر ملخصات بسيطة حول العينة والمقاييس. جنبا
إلى جنب مع تحليل الرسومات البسيط ، فإنها تشكل أساس كل تحليل كمي للبيانات
تقريبًا.
عادة ما يتم تمييز الإحصاء الوصفي عن الإحصاء الاستدلالي . باستخدام الإحصائيات
الوصفية ، فأنت ببساطة تصف ما هو أو ما تظهره البيانات. باستخدام
الإحصائيات الاستدلالية ، تحاول الوصول إلى استنتاجات تتجاوز البيانات المباشرة
وحدها. على
سبيل المثال ، نستخدم الإحصائيات الاستدلالية لمحاولة الاستنتاج من بيانات العينة
ما قد يعتقده السكان. أو
، نستخدم الإحصائيات الاستنتاجية لإصدار أحكام بشأن احتمال أن يكون الاختلاف
الملحوظ بين المجموعات يمكن الاعتماد عليه أو واحدًا قد يحدث بالصدفة في هذه
الدراسة. وبالتالي
، فإننا نستخدم الإحصائيات الاستدلالية لعمل استنتاجات من بياناتنا إلى شروط أكثر
عمومية ؛ نحن
نستخدم الإحصاء الوصفي ببساطة لوصف ما يجري في بياناتنا.
في كل مرة تحاول فيها وصف مجموعة كبيرة من الملاحظات بمؤشر
واحد ، فإنك تخاطر بتشويه البيانات الأصلية أو فقدان تفاصيل مهمة. متوسط الضرب لا
يخبرك ما إذا كان الضرب يضرب المنزل أو الفردي. لا
تخبرنا ما إذا كانت في حالة ركود أم في حالة ركود. لا
يخبرك المعدل التراكمي ما إذا كان الطالب في دورات صعبة أم دورات سهلة ، أو ما إذا
كانت دورات في مجال تخصصهم أو في تخصصات أخرى. حتى
في ظل هذه القيود ، توفر الإحصائيات الوصفية ملخصًا قويًا قد يتيح إجراء مقارنات
بين الأشخاص أو الوحدات الأخرى.
تحليل أحادي أو عديد
المتغير
يتضمن التحليل أحادي المتغير الفحص عبر حالات متغير واحد في
كل مرة. هناك
ثلاث خصائص رئيسية لمتغير واحد نميل إلى النظر إليها:
- التوزيع
- الاتجاه المركزي
- التشتت
في معظم الحالات ، نصف هذه الخصائص الثلاثة لكل متغير في
دراستنا.
التوزيع
التوزيع هو ملخص لتكرار القيم الفردية أو نطاقات القيم
لمتغير. أبسط
توزيع يسرد كل قيمة متغير وعدد الأشخاص الذين لديهم كل قيمة. على
سبيل المثال ، الطريقة النموذجية لوصف توزيع طلاب الجامعات هي حسب السنة في الكلية
، مع سرد عدد أو نسبة الطلاب في كل سنة من السنوات الأربع. أو
، نصف الجنس بإدراج عدد أو نسبة الذكور والإناث. في
هذه الحالات ، يحتوي المتغير على عدد قليل من القيم الكافية التي يمكننا سرد كل
منها وتلخيص عدد حالات العينة التي لها القيمة. ولكن
ماذا نفعل لمتغير مثل الدخل أو المعدل التراكمي؟ باستخدام
هذه المتغيرات يمكن أن يكون هناك عدد كبير من القيم الممكنة ، مع وجود عدد قليل
نسبيًا من الأشخاص لديهم كل منها. في
هذه الحالة ، نقوم بتجميع الدرجات الأولية في فئات وفقًا لنطاقات القيم. على سبيل المثال، قد ننظر إلى المعدل
التراكمي وفقًا لنطاقات درجات الحروف. أو
قد نقوم بتجميع الدخل في أربعة أو خمسة نطاقات لقيم الدخل.
الفئة
|
نسبه
مئويه
|
تحت
سن 35 سنة
|
9٪
|
36-45
|
21٪
|
46-55
|
45٪
|
56-65
|
19٪
|
66+
|
6٪
|
أحد أكثر الطرق شيوعًا لوصف متغير واحد هو توزيع التردد . اعتمادًا على المتغير
المحدد ، قد يتم تمثيل جميع قيم البيانات ، أو يمكنك تجميع القيم في فئات أولاً
(على سبيل المثال ، مع متغيرات العمر أو السعر أو درجة الحرارة ، لن يكون من
المنطقي عادةً تحديد الترددات لكل قيمة. بدلاً من ذلك ، يتم تجميع القيمة في
نطاقات وتحديد الترددات.). يمكن
تصوير توزيعات التردد بطريقتين ، كجدول أو كرسم بياني. يوضح
الجدول أعلاه توزيع التكرار العمري مع تحديد خمس فئات من الفئات العمرية. يمكن تصوير نفس توزيع
التردد في رسم بياني كما هو موضح في الشكل 1. وغالبًا ما يشار إلى هذا النوع من
الرسم البياني على أنه مخطط بياني أو مخطط شريطي.
الشكل 1. مخطط شريط توزيع التردد.
يمكن أيضًا عرض التوزيعات باستخدام النسب المئوية. على سبيل المثال ،
يمكنك استخدام النسب المئوية لوصف:
- النسبة المئوية
للأشخاص في مستويات الدخل المختلفة
- النسبة المئوية
للأشخاص في مختلف الفئات العمرية
- النسبة المئوية للأشخاص
في نطاقات مختلفة من درجات الاختبار الموحدة
النزعة المركزية
الاتجاه المركزي للتوزيع هو تقدير "مركز" توزيع
القيم. هناك
ثلاثة أنواع رئيسية من تقديرات الاتجاه المركزي:
- تعني
- الوسيط
- الوضع
في المتوسط أو المتوسط ربما يكون
الأسلوب الأكثر شيوعا لوصف النزعة المركزية. لحساب
المتوسط ، كل ما تفعله هو جمع كل القيم والقسمة على عدد القيم. على سبيل المثال ،
يتم تحديد متوسط درجة الاختبار أو متوسطها عن طريق جمع جميع الدرجات والقسمة على
عدد الطلاب الذين يؤدون الاختبار. على
سبيل المثال ، ضع في اعتبارك قيم درجات الاختبار:
15, 20, 21, 20, 36, 15, 25, 15
مجموع هذه القيم الثمانية هو 167، إذن المتوسط هو 167/8 = 20.875.
و الوسيط هو النتيجة التي عثر
عليها في وسط الدقيق لمجموعة من القيم. تتمثل
إحدى طرق حساب الوسيط في سرد جميع الدرجات بترتيب رقمي ، ثم تحديد موقع الدرجة
في وسط العينة. على
سبيل المثال ، إذا كانت هناك 500 درجة في القائمة ، فستكون الدرجة # 250 هي الوسيط. إذا طلبنا الدرجات
الثمانية الموضحة أعلاه ، فسنحصل على:
15, 15, 15, 20, 20, 21, 25, 36
هناك 8 درجات وتمثل النتيجة # 4 و # 5 نقطة المنتصف. نظرًا لأن كلا من هذه
الدرجات 20، فإن الوسيط هو 20. إذا
كانت النقطتان الوسطيتان لهما قيم مختلفة ، فسيتعين عليك استيفاء تحديد الوسيط.
و الوضع هو القيمة الأكثر
تكرارا في مجموعة من النقاط. لتحديد
الوضع ، يمكنك طلب النتائج مرة أخرى كما هو موضح أعلاه ، ثم عد كل منها. القيمة الأكثر تكرارا
هي الوضع. في
مثالنا ، 15تحدث القيمة ثلاث مرات وهي
النموذج. يوجد
في بعض التوزيعات أكثر من قيمة نمطية. على
سبيل المثال ، في التوزيع ثنائي النسق توجد قيمتان تحدثان في أغلب الأحيان.
لاحظ أن لنفس مجموعة من 8 درجات وصلنا ثلاث قيم مختلفة ( 20.875، 20و 15) عن
الوسط الحسابي والوسيط ووضع على التوالي. إذا
كان التوزيع طبيعيًا حقًا (أي على شكل جرس) ، فإن المتوسط والوسيط والأسلوب كلها
متساوية مع بعضها البعض.
تشتت
يشير التشتت إلى انتشار القيم حول الاتجاه المركزي. هناك نوعان من
المقاييس الشائعة للتشتت ، النطاق والانحراف المعياري. على مدى هو ببساطة أعلى قيمة
ناقص أقل قيمة. في
مثالنا للتوزيع ، القيمة العالية هي 36والصغرى 15، لذا النطاق هو 36 - 15 = 21.
و الانحراف
المعياري هو
تقدير أكثر دقة وتفصيلا من التشتت بسبب عزلاء يمكن المبالغة إلى حد كبير من نطاق
(كما كان الحال في هذا المثال حيث قيمة عزلاء واحدة من 36المدرجات وبصرف النظر
عن بقية القيم. المعيار يبين انحراف العلاقة أن مجموعة من الدرجات يجب أن يكون
متوسط العينة. مرة أخرى ، لنأخذ مجموعة الدرجات:
15, 20, 21, 20, 36, 15, 25, 15
لحساب الانحراف المعياري ، نجد أولاً المسافة بين كل قيمة
والمتوسط. نعلم
من فوق أن المتوسط 20.875. إذن
، الاختلافات عن المتوسط هي:
15 - 20.875 = -5.875
20 - 20.875 = -0.875
21 - 20.875 = +0.125
20 - 20.875 = -0.875
36 - 20.875 = 15.125
15 - 20.875 = -5.875
25 - 20.875 = +4.125
15 - 20.875 = -5.875
لاحظ أن القيم التي تقل عن المتوسط تحتوي على تناقضات
سلبية والقيم الأعلى منها لها قيم إيجابية. بعد
ذلك ، نقوم بترتيب كل تناقض:
-5.875 * -5.875 =
34.515625
-0.875 * -0.875 =
0.765625
+0.125 * +0.125 =
0.015625
-0.875 * -0.875 =
0.765625
15.125 * 15.125 =
228.765625
-5.875 * -5.875 =
34.515625
+4.125 * +4.125 =
17.015625
-5.875 * -5.875 =
34.515625
الآن ، نأخذ هذه "المربعات" ونجمعها للحصول على
قيمة مجموع المربعات (SS). هنا
، المجموع 350.875. بعد
ذلك ، نقسم هذا المجموع على عدد الدرجات ناقصًا 1. هنا
، النتيجة 350.875
/ 7 = 50.125. تُعرف هذه القيمة
باسم التباين . للحصول على الانحراف
المعياري ، نأخذ الجذر التربيعي للتباين (تذكر أننا قمنا بتربيع الانحرافات سابقًا). سيكون هذا SQRT(50.125) = 7.079901129253.
على الرغم من أن هذا الحساب قد يبدو معقدًا ، إلا أنه في
الواقع بسيط للغاية. لرؤية
هذا ، ضع في اعتبارك صيغة الانحراف المعياري:
\ sqrt {\ frac {\ sum (X- \ bar {X}) ^ 2} {n-1}}ن-1∑ ( X-Xˉ)2
أين:
- X هي كل درجة ،
- X̄ هو المتوسط (أو المتوسط) ،
- n هو عدد القيم ،
- Σ يعني أننا نجمع عبر القيم.
في الجزء العلوي من النسبة ، البسط ، نرى أن كل درجة لها
متوسط مطروح منها ، والفرق مربّع ، ويتم جمع المربعات. في
الجزء السفلي ، نأخذ عدد الدرجات مطروحًا منه 1. النسبة
هي التباين والجذر التربيعي هو الانحراف المعياري. في
اللغة الإنجليزية ، يمكننا وصف الانحراف المعياري على النحو التالي:
الجذر
التربيعي لمجموع الانحرافات التربيعية عن المتوسط مقسومًا على عدد الدرجات ناقص
واحد.
على الرغم من أنه يمكننا حساب هذه الإحصائيات أحادية
المتغير يدويًا ، إلا أنها تصبح مملة جدًا عندما يكون لديك أكثر من عدد قليل من
القيم والمتغيرات. كل
برنامج إحصائي قادر على حسابها بسهولة من أجلك. على
سبيل المثال ، وضعت الدرجات الثمانية في SPSS وحصلت
على الجدول التالي نتيجة لذلك:
قياس
|
القيمة
|
ن
|
8
|
تعني
|
20.8750
|
الوسيط
|
20.0000
|
الوضع
|
15.00
|
الانحراف
المعياري
|
7.0799
|
التباين
|
50.1250
|
نطاق
|
21.00
|
مما يؤكد الحسابات التي قمت بها يدويًا أعلاه.
يسمح لنا الانحراف المعياري بالتوصل إلى بعض الاستنتاجات
حول درجات معينة في توزيعنا. بافتراض
أن توزيع الدرجات طبيعي أو على شكل جرس (أو قريب منه!) ، يمكن الوصول إلى
الاستنتاجات التالية:
- ما يقرب من 68٪
من الدرجات في العينة تقع ضمن انحراف معياري واحد عن المتوسط
- ما يقرب من 95٪
من الدرجات في العينة تقع ضمن انحرافين معياريين عن المتوسط
- ما يقرب من 99٪
من الدرجات في العينة تقع ضمن ثلاثة انحرافات معيارية عن المتوسط
على سبيل المثال، منذ يعني في مثالنا هو 20.875والانحراف
المعياري هو 7.0799، يمكننا من تقدير العبارة أعلاه أن ما يقرب من 95٪ من الدرجات،
سوف يقعون في نطاق 20.875-(2*7.0799)ل 20.875+(2*7.0799)أو
بين 6.7152و 35.0348. هذا
النوع من المعلومات هو نقطة انطلاق مهمة لتمكيننا من مقارنة أداء الفرد في متغير
واحد مع أدائه على آخر ، حتى عندما يتم قياس المتغيرات على مقاييس مختلفة تمامًا.
لطلب تحليل
احصائي التواصل عبر الواتسب اضغط
هنا
ليست هناك تعليقات:
إرسال تعليق