عند
تعلم الإحصائيات ، من السهل أن تتورط في التفاصيل وتفقد الصورة الكبيرة. فيما يلي أهم اثني عشر مفهومًا في الاستدلال
الإحصائي.
تتيح لك الإحصائيات التوصل إلى استنتاجات عامة
من بيانات محدودة.
بيت
القصيد من الإحصاءات الاستنتاجية هو الاستقراء من البيانات المحدودة للتوصل إلى
نتيجة عامة. يصف
مصطلح "الإحصاء الوصفي" البيانات ببساطة دون التوصل إلى أي استنتاجات
عامة. لكن
الجوانب الصعبة والصعبة للإحصاءات تدور حول الوصول إلى استنتاجات عامة من البيانات
المحدودة.
الإحصائيات ليست بديهية.
لكلمة
"حدسي" معنيان. أحد
المعاني هو "سهل الاستخدام والفهم". كان
هذا هدفي عندما كتبت الإحصاء
الحيوي الحدسي . المعنى
الآخر لـ "حدسي" هو "غريزي ، أو التصرف بناءً على ما يشعر المرء
أنه حقيقي حتى بدون سبب". باستخدام
هذا التعريف ، يكون الاستدلال الإحصائي بعيدًا عن الحدس. عند
التفكير في البيانات ، غالبًا ما يضلنا الحدس. كثيرًا
ما يرى الناس أنماطًا في البيانات العشوائية وغالبًا ما يقفزون إلى استنتاجات غير
مبررة. الدقة
الإحصائية مطلوبة للتوصل إلى استنتاجات صحيحة من البيانات.
يتم تقديم الاستنتاجات الإحصائية دائمًا من حيث الاحتمالية.
"الإحصاءات تعني ألا تضطر أبدًا إلى القول بأنك
متأكد." إذا
بدا الاستنتاج الإحصائي مؤكدًا ، فمن المحتمل أنك تسيء فهم شيء ما. بيت القصيد من الإحصاء هو تحديد عدم اليقين.
تستند جميع الاختبارات الإحصائية على الافتراضات.
يعتمد
كل استنتاج إحصائي على قائمة من الافتراضات. لا
تحاول تفسير أي نتائج إحصائية إلا بعد مراجعة تلك القائمة. الافتراض
الكامن وراء كل حساب إحصائي هو أن البيانات قد تم أخذ عينات منها بشكل عشوائي ، أو
على الأقل ممثلة لمجموعة أكبر من القيم التي كان من الممكن جمعها. إذا كانت بياناتك لا تمثل مجموعة أكبر من
البيانات التي كان من الممكن أن تجمعها (لكنك لم تجمعها) ، فإن الاستدلال الإحصائي
لا معنى له.
يجب اتخاذ القرارات بشأن كيفية تحليل البيانات
مسبقًا.
يتطلب
تحليل البيانات العديد من القرارات. اختبار
حدودي أم غير معلمي؟ القضاء
على القيم المتطرفة أم لا؟ تحويل
البيانات أولا؟ التطبيع
لقيم التحكم الخارجية؟ التكيف
مع المتغيرات المشتركة؟ استخدام
عوامل الترجيح في الانحدار؟ يجب
أن تكون كل هذه القرارات (وأكثر) جزءًا من التصميم التجريبي. عندما
يتم اتخاذ القرارات بشأن التحليل الإحصائي بعد فحص البيانات ، يكون من السهل جدًا
على التحليل الإحصائي أن يصبح لوحة Ouja عالية
التقنية - طريقة لإنتاج نتائج مسبقة ، بدلاً من كونها طريقة موضوعية لتحليل
البيانات. الاسم
الجديد لهذا هو p-hacking.
تحدد فترة الثقة الدقة ، ويسهل تفسيرها.
لنفترض
أنك قمت بحساب متوسط مجموعة من القيم التي جمعتها ، أو نسبة الموضوعات التي وقع
فيها حدث ما. تصف
هذه القيم العينة التي قمت بتحليلها. ولكن
ماذا عن إجمالي السكان الذين أخذت عينات منهم؟ قد
يكون متوسط السكان الحقيقي (أو النسبة) أعلى ، أو قد يكون أقل. يأخذ حساب فاصل الثقة 95٪ في الاعتبار حجم
العينة والتشتت. بالنظر
إلى مجموعة من الافتراضات ، يمكنك أن تكون متأكدًا بنسبة 95٪ من أن فاصل الثقة
يتضمن القيمة الحقيقية للمجموعة (والتي لا يمكنك أن تعرفها إلا على وجه اليقين من
خلال جمع كمية غير محدودة من البيانات). بالطبع
، لا يوجد شيء مميز حول 95٪ باستثناء التقاليد. يمكن
حساب فترات الثقة لأي درجة من الثقة المطلوبة. جميع
النتائج تقريبًا - النسب ، المخاطر النسبية ، نسب الأرجحية ، الوسائل ، الفروق بين
الوسائل ، المنحدرات ،
تختبر قيمة AP فرضية
فارغة ، ويصعب فهمها في البداية.
يبدو
منطق القيمة P غريبًا
في البداية. عند
اختبار ما إذا كانت مجموعتان مختلفتان (متوسط مختلف ، نسبة مختلفة ، إلخ) ،
افترض أولاً أن المجموعتين متطابقتين في الواقع. هذا
يسمى فرضية العدم. ثم
اسأل: إذا كانت الفرضية الصفرية صحيحة ، فما مدى احتمالية الحصول على عينات
عشوائيًا حيث يكون الفرق كبيرًا (أو حتى أكبر) مما لوحظ بالفعل؟ إذا كانت قيمة P كبيرة
، فإن بياناتك تتوافق مع فرضية العدم. إذا
كانت قيمة P صغيرة
، فهناك فرصة صغيرة فقط لأن تكون الفرصة العشوائية قد أحدثت فرقًا كبيرًا كما لوحظ
بالفعل. هذا
يجعلك تتساءل عما إذا كانت الفرضية الصفرية صحيحة. إذا
لم تتمكن من تحديد الفرضية الصفرية ، فلا يمكنك تفسير القيمة P.
لا تعني "ذات دلالة إحصائية" أن
التأثير كبير أو مهم علميًا.
إذا
كانت قيمة P أقل
من 0.05 (حد تعسفي ، ولكن مقبول جيدًا) ، تُعتبر النتائج ذات دلالة إحصائية. هذه العبارة تبدو حاسمة للغاية. لكن كل ما يعنيه ذلك هو أنه ، بالصدفة وحدها ،
فإن الاختلاف (أو الارتباط أو الارتباط ..) الذي لاحظته (أو ارتباط أكبر) سيحدث
أقل من 5٪ من الوقت. هذا
هو. يمكن
أن يكون التأثير الصغير الذي يكون تافهًا علميًا أو سريريًا ذا دلالة إحصائية
(خاصة مع العينات الكبيرة). قد
يكون هذا الاستنتاج خاطئًا أيضًا ، حيث ستصل إلى نتيجة مفادها أن النتائج ذات
دلالة إحصائية بنسبة 5٪ من الوقت فقط عن طريق الصدفة.
لا تعني عبارة "عدم الاختلاف الكبير"
أن التأثير غائب أو صغير أو غير ذي صلة علميًا.
إذا
لم يكن الاختلاف ذا دلالة إحصائية ، فيمكنك استنتاج أن النتائج الملاحظة لا تتعارض
مع فرضية العدم. لاحظ
السالب المزدوج. لا
يمكنك استنتاج أن الفرضية الصفرية صحيحة. من
الممكن تمامًا أن تكون الفرضية الصفرية خاطئة ، وأن هناك بالفعل فرقًا بين السكان. هذه مشكلة خاصة مع أحجام العينات الصغيرة. من المنطقي تحديد نتيجة ما على أنها ذات دلالة
إحصائية أو ليست ذات دلالة إحصائية عندما تحتاج إلى اتخاذ قرار بناءً على هذه
النتيجة الواحدة. خلاف
ذلك ، فإن مفهوم الأهمية الإحصائية يضيف القليل لتحليل البيانات.
المقارنات المتعددة تجعل من الصعب تفسير النتائج
الإحصائية.
عندما
يتم اختبار العديد من الفرضيات في وقت واحد ، فإن مشكلة المقارنات المتعددة تجعل
من السهل جدًا خداعك. إذا
كانت 5٪ من الاختبارات "ذات دلالة إحصائية" بالصدفة ، فإنك تتوقع الكثير
من النتائج ذات الدلالة الإحصائية إذا اختبرت العديد من الفرضيات. يمكن استخدام طرق خاصة لتقليل مشكلة العثور على
نتائج خاطئة ولكنها ذات دلالة إحصائية ، ولكن هذه الأساليب تجعل من الصعب أيضًا
العثور على التأثيرات الحقيقية. يمكن
أن تكون المقارنات المتعددة خادعة. من
الممكن فقط تفسير التحليلات الإحصائية بشكل صحيح عندما يتم التخطيط لجميع التحليلات
، ويتم إجراء جميع التحليلات المخطط لها والإبلاغ عنها. ومع
ذلك ، يتم كسر هذه القواعد البسيطة على نطاق واسع.
الارتباط لا يعني السببية.
قد
يشير ارتباط أو ارتباط ذو دلالة إحصائية بين متغيرين إلى أن أحد المتغيرات يسبب
الآخر. ولكن
قد يعني ذلك فقط أن كلاهما يتأثر بمتغير ثالث. أو
قد تكون مصادفة.
تميل الإحصاءات المنشورة إلى التفاؤل.
بحلول
الوقت الذي تقرأ فيه مقالة ، يكون قد حدث قدر كبير من الاختيار. عندما تنجح التجارب ، يواصل العلماء المشروع. يتم التخلي عن الكثير من المشاريع الأخرى. عند
الانتهاء من المشروع ، من المرجح أن يكتب العلماء مشاريع تؤدي إلى نتائج ملحوظة ،
أو يواصلون تحليل البيانات بطرق مختلفة لاستخراج نتيجة "ذات دلالة إحصائية". أخيرًا ، من المرجح أن تنشر المجلات دراسات
"إيجابية". إذا
كانت الفرضية الصفرية صحيحة ، فستتوقع نتيجة ذات دلالة إحصائية في 5٪ من التجارب. لكن من المرجح أن يتم نشر هؤلاء الـ 5٪ أكثر من
الـ 95٪ الأخرى.
لطلب تحليل
احصائي التواصل عبر الواتسب اضغط
هنا
ليست هناك تعليقات:
إرسال تعليق