أمثلة إحصائية مضللة - اكتشف احتمالية إساءة استخدام الإحصائيات والبيانات
في العصر الرقمي
طالما كانت التحليلات الإحصائية من الناحية التاريخية دعامة
قوية لصناعات التكنولوجيا العالية والأعمال التجارية المتقدمة ، وهي اليوم أكثر
أهمية من أي وقت مضى. مع ظهور التكنولوجيا المتقدمة
والعمليات المعولمة ، تمنح التحليلات الإحصائية الشركات نظرة ثاقبة لحل حالات عدم
اليقين الشديدة في السوق. تعزز الدراسات صنع القرار المستنير ،
والأحكام السليمة والإجراءات التي يتم تنفيذها على أساس وزن الأدلة ، وليس
الافتراضات.
نظرًا لأن الشركات غالبًا ما تُجبر على اتباع خارطة طريق للسوق
يصعب تفسيرها ، يمكن للطرق الإحصائية أن تساعد في التخطيط الضروري للتنقل في مشهد
مليء بالحفر والمزالق والمنافسة العدائية. يمكن أن تساعد الدراسات الإحصائية
أيضًا في تسويق السلع أو الخدمات ، وفي فهم محركات القيمة الفريدة لكل أسواق
مستهدفة. في العصر الرقمي ، يتم تحسين هذه
القدرات وتسخيرها فقط من خلال تطبيق التكنولوجيا المتقدمة وبرامج ذكاء
الأعمال . إذا كان كل هذا صحيحًا ، فما هي مشكلة
الإحصاء؟
في الواقع ، لا توجد مشكلة في حد ذاتها - ولكن يمكن أن توجد. الإحصاءات سيئة السمعة لقدرتها وإمكانية وجودها على أنها
بيانات مضللة وسيئة .
ما هي الإحصائية المضللة؟
الإحصائيات المضللة هي ببساطة إساءة استخدام - سواء كانت
مقصودة أم لا - للبيانات الرقمية. توفر النتائج معلومات مضللة إلى المتلقي
، الذي يعتقد بعد ذلك أن شيئًا ما خطأ إذا لم يلاحظ الخطأ أو لم يكن لديه صورة
البيانات الكاملة.
نظرًا لأهمية البيانات في العالم الرقمي سريع التطور اليوم ،
من المهم أن تكون على دراية بأساسيات الإحصائيات المضللة والرقابة. كتمرين في العناية الواجبة ، سنراجع بعض الأشكال الأكثر شيوعًا
لإساءة استخدام الإحصائيات ، والعديد من الأمثلة الإحصائية المضللة (للأسف ،
الشائعة) من الحياة العامة.
هل الإحصائيات موثوقة؟
73.6٪ من الإحصائيات خاطئة . هل حقا؟ لا ، بالطبع هو رقم اصطناعي (على
الرغم من أن مثل هذه الدراسة ستكون مثيرة للاهتمام - ولكن مرة أخرى ، يمكن أن
تحتوي على كل العيوب التي تحاول الإشارة إليها في نفس الوقت). الموثوقية الإحصائية أمر بالغ الأهمية
لضمان دقة وصحة التحليل. للتأكد من أن الموثوقية عالية ، هناك
العديد من التقنيات التي يجب إجراؤها - أولها اختبارات التحكم ، والتي يجب أن يكون
لها نتائج مماثلة عند إعادة إنتاج تجربة في ظروف مماثلة. تعد إجراءات التحكم هذه ضرورية ويجب
أن تكون جزءًا من أي تجربة أو استطلاع - لسوء الحظ ، هذا ليس هو الحال دائمًا.
في حين أن الأرقام لا تكذب ، يمكن استخدامها في الواقع لتضليل
أنصاف الحقائق. يُعرف هذا باسم "إساءة استخدام
الإحصائيات". غالبًا ما يُفترض أن إساءة استخدام
الإحصاءات مقصورة على الأفراد أو الشركات التي تسعى إلى جني الأرباح من تشويه
الحقيقة ، سواء كان ذلك في الاقتصاد أو التعليم أو وسائل الإعلام.
ومع ذلك ، فإن سرد أنصاف الحقائق من خلال الدراسة لا يقتصر فقط
على هواة الرياضيات. وجد استطلاع استقصائي أجراه الدكتور
دانييل فانيلي من جامعة إدنبرة عام 2009 أن 33.7٪ من العلماء الذين شملهم الاستطلاع اعترفوا بممارسات بحث مشكوك فيها ، بما
في ذلك تعديل النتائج لتحسين النتائج ، وتفسير البيانات الشخصية ، وحجب التفاصيل
التحليلية وإسقاط الملاحظات بسبب المشاعر الغريزية
.... العلماء!
في حين أن الأرقام لا يجب أن تكون ملفقة أو مضللة دائمًا ، فمن
الواضح أنه حتى المجتمعات الأكثر ثقة في حراس البوابات الرقمية ليست محصنة ضد
الإهمال والتحيز الذي يمكن أن ينشأ مع عمليات التفسير الإحصائي. هناك طرق مختلفة يمكن أن تكون بها الإحصائيات مضللة والتي
سنقوم بتفصيلها لاحقًا. العامل الأكثر شيوعًا هو بالطبع
الارتباط مقابل السببية ، والذي دائمًا ما يغفل عاملًا آخر (أو اثنين أو ثلاثة)
يمثلان السبب الفعلي للمشكلة. شرب الشاي يزيد مرض السكري بنسبة 50٪
والصلع يزيد من مخاطر الإصابة بأمراض القلب والأوعية الدموية بنسبة تصل إلى 70٪! هل نسينا ذكر كمية السكر الموضوعة في الشاي ، أو حقيقة أن
الصلع والشيخوخة مرتبطان - تمامًا مثل مخاطر أمراض القلب والأوعية الدموية
والشيخوخة؟
إذن ، هل يمكن التلاعب بالإحصاءات؟ يمكنهم بالتأكيد. هل تكذب الأرقام؟ يمكنك أن تكون القاضي.
كيف يمكن أن تكون الإحصائيات مضللة
تذكر أن إساءة استخدام الإحصائيات يمكن أن تكون عرضية أو هادفة. في حين أن النية الخبيثة لتعتيم الخطوط بإحصاءات مضللة ستؤدي
بالتأكيد إلى تضخيم التحيز ، فإن النية ليست ضرورية لخلق سوء فهم. إن إساءة استخدام الإحصائيات هي مشكلة أوسع نطاقا تتخلل الآن
العديد من الصناعات ومجالات الدراسة. في ما يلي بعض الحوادث المحتملة التي
تؤدي عادةً إلى سوء الاستخدام:
·
الاقتراع
الخاطئ
يمكن أن يكون للطريقة التي يتم بها صياغة الأسئلة تأثير كبير
على الطريقة التي يجيب بها الجمهور عليها. أنماط الصياغة المحددة لها تأثير مقنع
وتحفز المستجيبين على الإجابة بطريقة يمكن التنبؤ بها. على سبيل المثال ، في استطلاع للرأي
يسعى للحصول على آراء ضريبية ، دعنا نلقي نظرة على السؤالين المحتملين:
- هل
تعتقد أنه يجب أن تخضع للضريبة حتى لا يضطر المواطنون الآخرون إلى العمل؟ - هل تعتقد أن الحكومة يجب أن تساعد أولئك الذين لا يجدون عملاً؟
من المحتمل أن يثير هذان السؤالان ردودًا مختلفة تمامًا ، على
الرغم من أنهما يتعاملان مع نفس موضوع المساعدة الحكومية. هذه أمثلة على "الأسئلة المحملة".
وهناك طريقة أكثر دقة لصياغة السؤال وهي "هل تدعم برامج
المساعدة الحكومية للبطالة؟" أو (بشكل أكثر حيادية) "ما هي
وجهة نظرك فيما يتعلق بمساعدة البطالة؟"
المثالان الأخيران للأسئلة الأصلية يلغيان أي استنتاج أو
اقتراح من المستطلع ، وبالتالي ، يكونان أكثر حيادية بشكل ملحوظ. هناك طريقة أخرى غير عادلة للاستطلاع وهي طرح سؤال ، ولكن قبله
ببيان شرطي أو بيان حقيقة. بالبقاء مع مثالنا ، سيبدو هذا على
النحو التالي: "نظرًا لارتفاع التكاليف التي تتحملها الطبقة الوسطى ، هل تدعم
برامج المساعدة الحكومية؟"
من القواعد الأساسية الجيدة أن تأخذ الاقتراع بحذر ، وأن تحاول
مراجعة الأسئلة التي تم تقديمها بالفعل. أنها توفر رؤية عظيمة ، في كثير من
الأحيان أكثر من الإجابات.
·
الارتباطات المعيبة
المشكلة في الارتباطات هي: إذا قمت بقياس عدد كافٍ من
المتغيرات ، فسوف يظهر في النهاية أن بعضها مرتبط. نظرًا لأن واحدًا
من بين عشرين شخصًا سيعتبر حتمًا مهمًا دون أي ارتباط
مباشر ، يمكن التلاعب بالدراسات (ببيانات كافية) لإثبات وجود ارتباط غير موجود أو
ليس مهمًا بما يكفي لإثبات السببية.
لتوضيح هذه النقطة بشكل أكبر ، لنفترض أن إحدى الدراسات قد
وجدت علاقة بين زيادة حوادث السيارات في ولاية نيويورك في شهر يونيو (أ) ، وزيادة
هجمات الدب في ولاية نيويورك في شهر حزيران (ب).
هذا يعني أنه من المحتمل أن يكون هناك ستة تفسيرات محتملة:
- حوادث
السيارات (أ) تسبب هجمات الدب (ب) - هجمات الدب (ب) تسبب حوادث السيارات (أ) -
حوادث السيارات (أ) وهجمات الدب (ب) تسبب بعضها البعض جزئيًا - حوادث السيارات (أ)
وهجمات الدب ( ب) ناتجة عن عامل ثالث (ج) - هجمات الدب (ب) ناتجة عن عامل ثالث (ج)
يرتبط بحوادث السيارات (أ) - الارتباط مجرد صدفة
يمكن لأي شخص عاقل أن يتعرف بسهولة على حقيقة أن حوادث
السيارات لا تسبب هجمات الدب. من المحتمل أن يكون كل منها نتيجة
لعامل ثالث ، وهو: زيادة عدد السكان ، بسبب ارتفاع موسم السياحة في شهر يونيو. سيكون من غير المعقول أن نقول إنهم يتسببون في بعضهم البعض ...
وهذا هو بالضبط سبب كونه مثالنا. من السهل رؤية الارتباط.
لكن ماذا عن السببية؟ ماذا لو كانت المتغيرات المقاسة
مختلفة؟ ماذا لو كان شيئًا أكثر تصديقًا ، مثل
مرض الزهايمر والشيخوخة؟ من الواضح أن هناك علاقة بين الاثنين
، ولكن هل هناك علاقة سببية؟ قد يفترض الكثيرون خطأً ، نعم ،
استنادًا إلى قوة الارتباط فقط. انطلق بحذر ، سواء عن علم أو عن جهل ، سيستمر البحث
عن الارتباط في الدراسات الإحصائية.
·
صيد البيانات
يشار إلى مثال البيانات المضللة هذا أيضًا باسم "تجريف
البيانات" (والمتعلق بالارتباطات المعيبة). إنها تقنية للتنقيب عن البيانات حيث
يتم تحليل كميات كبيرة للغاية من البيانات لأغراض اكتشاف العلاقات بين نقاط
البيانات. إن البحث عن علاقة بين البيانات لا
يعد إساءة استخدام للبيانات في حد ذاته ، ومع ذلك ، فإن القيام بذلك بدون فرضية هو.
تجريف البيانات هو أسلوب يخدم الذات غالبًا ما يتم استخدامه
لغرض غير أخلاقي للتحايل على تقنيات التنقيب عن البيانات التقليدية ، من أجل البحث
عن استنتاجات بيانات إضافية غير موجودة. هذا لا يعني أنه لا يوجد استخدام
مناسب للتنقيب في البيانات ، حيث يمكن أن يؤدي في الواقع إلى مفاجأة القيم
المتطرفة والتحليلات المثيرة للاهتمام. ومع ذلك ، في أغلب الأحيان ، يتم
استخدام تجريف البيانات لافتراض وجود علاقات بيانات دون مزيد من الدراسة.
في كثير من الأحيان ، ينتج عن صيد البيانات دراسات يتم نشرها
بشكل كبير بسبب نتائجها المهمة أو الغريبة. سرعان
ما تتعارض هذه الدراسات مع
نتائج أخرى مهمة أو غريبة. غالبًا ما تترك هذه الارتباطات الخاطئة عامة الناس في حيرة من
أمرهم ، ويبحثون عن إجابات فيما يتعلق بأهمية العلاقة السببية والارتباط.
وبالمثل ، هناك ممارسة شائعة أخرى مع البيانات وهي الحذف ، مما
يعني أنه بعد النظر إلى مجموعة بيانات كبيرة من الإجابات ، فإنك تختار فقط
الإجابات التي تدعم وجهات نظرك ونتائجك وتتجاهل تلك التي تتعارض معها. كما ورد في بداية هذا المقال ، فقد تبين أن ثلث العلماء
اعترفوا بأن لديهم ممارسات بحثية مشكوك فيها ، ومنها حجب التفاصيل التحليلية
وتعديل النتائج ...! ولكن مرة أخرى ، نحن نواجه دراسة يمكن
أن تقع في حد ذاتها ضمن 33٪ من الممارسات المشكوك فيها ، والاستطلاعات الخاطئة ،
والتحيز الانتقائي ... ويصبح من الصعب تصديق أي تحليل!
·
تصور البيانات المضللة
تتضمن الرسوم البيانية والمخططات الثاقبة تجميعًا أساسيًا
للغاية ، ولكنه أساسي للعناصر. مهما كانت أنواع
تصور البيانات التي تختار استخدامها ، يجب أن تنقل:
- المقاييس
المستخدمة - قيمة البداية (صفر أو غير ذلك) - طريقة الحساب (على سبيل المثال ،
مجموعة البيانات والفترة الزمنية)
في غياب هذه العناصر ، يجب عرض تمثيلات البيانات المرئية بحذر
، مع الأخذ في الاعتبار أخطاء
تصور البيانات الشائعة التي يمكن للمرء ارتكابها. يجب أيضًا تحديد نقاط البيانات الوسيطة وإعطاء السياق إذا كان
سيضيف قيمة إلى المعلومات المقدمة. مع زيادة الاعتماد على أتمتة الحلول
الذكية لمقارنات نقاط البيانات المتغيرة ، يجب تنفيذ أفضل الممارسات (أي التصميم
والقياس) قبل مقارنة البيانات من مصادر ومجموعات بيانات وأوقات ومواقع مختلفة.
·
التحيز الهادف والاختياري
ربما تكون آخر الأمثلة الأكثر شيوعًا لإساءة استخدام
الإحصائيات والبيانات المضللة هي الأكثر خطورة. التحيز الهادف هو محاولة متعمدة
للتأثير على نتائج البيانات دون التظاهر بالمساءلة المهنية. من المرجح أن يتخذ التحيز شكل حذف
البيانات أو تعديلها.
التحيز الانتقائي أكثر تحفظًا قليلاً بالنسبة لمن لا يقرأ
السطور الصغيرة. عادة ما تقع على عينة من الأشخاص
الذين شملهم الاستطلاع. على سبيل المثال ، طبيعة مجموعة
الأشخاص الذين شملهم الاستطلاع: سؤال فصل من طلاب الكلية عن السن القانوني للشرب ،
أو مجموعة من المتقاعدين عن نظام رعاية المسنين. سوف ينتهي بك الأمر مع خطأ إحصائي
يسمى "التحيز الانتقائي".
·
استخدام النسبة المئوية للتغير مع حجم عينة صغير
هناك طريقة أخرى لإنشاء إحصاءات مضللة ، مرتبطة أيضًا باختيار
العينة التي تمت مناقشتها أعلاه ، وهي حجم العينة المذكورة. عندما يتم إجراء تجربة أو مسح على حجم
عينة غير مهم تمامًا ، فلن تكون النتائج غير قابلة للاستخدام فحسب ، ولكن طريقة
عرضها - أي كنسب مئوية - ستكون مضللة تمامًا.
طرح سؤال على عينة حجمها 20 شخصًا ، حيث 19 إجابة بـ
"نعم" (= 95٪ أجابوا بنعم) مقابل طرح نفس السؤال على 1000 شخص و 950
إجابة بـ "نعم" (= 95٪ أيضًا): صحة من الواضح أن النسبة ليست هي نفسها. سيكون تقديم النسبة المئوية للتغيير فقط بدون الأرقام
الإجمالية أو حجم العينة مضللاً تمامًا. يوضح الرسم الهزلي لـ xkdc هذا الأمر جيدًا ، لإظهار كيف أن
الادعاء "الأسرع نموًا" هو خطاب تسويقي نسبي تمامًا:
وبالمثل ، يتأثر حجم العينة المطلوب بنوع السؤال الذي تطرحه ،
والأهمية الإحصائية التي تحتاجها (الدراسة السريرية مقابل دراسة الأعمال) ،
والتقنية الإحصائية. إذا قمت بإجراء تحليل كمي ، فإن أحجام
العينات التي تقل عن 200 شخص عادة ما تكون غير صالحة.
أمثلة إحصائية مضللة في الحياة الواقعية
الآن بعد أن قمنا بمراجعة العديد من الأساليب الأكثر شيوعًا
لإساءة استخدام البيانات ، فلنلقِ نظرة على العديد من أمثلة العصر الرقمي
للإحصاءات المضللة عبر ثلاثة أطياف متميزة ولكنها مرتبطة: الإعلام والسياسة
والإعلان والعلوم. في حين أن بعض الموضوعات المدرجة هنا
من المحتمل أن تثير المشاعر اعتمادًا على وجهة نظر المرء ، فإن إدراجها هو لأغراض
عرض البيانات فقط.
·
أمثلة على الإحصائيات المضللة في الإعلام والسياسة
الإحصائيات المضللة في وسائل الإعلام شائعة جدًا. في 29 سبتمبر 2015 ، استجوب الجمهوريون من الكونجرس الأمريكي
سيسيل ريتشاردز ، رئيس منظمة الأبوة المخططة ، بشأن اختلاس 500 مليون دولار من
التمويل الفيدرالي السنوي. تم تقديم الرسم البياني / الرسم
البياني أعلاه كنقطة تركيز.
أوضح النائب جيسون شافيتز من ولاية يوتا: "باللون الوردي
، هذا هو الانخفاض في فحوصات الثدي ، واللون الأحمر هو الزيادة في عمليات الإجهاض. هذا ما يحدث في مؤسستك
".
بناءً على هيكل الرسم البياني ، يبدو في الواقع أنه يُظهر أن
عدد عمليات الإجهاض منذ عام 2006 شهد نموًا كبيرًا ، في حين انخفض عدد فحوصات
السرطان بشكل كبير. القصد من ذلك هو نقل التركيز من
فحوصات الكشف عن السرطان إلى الإجهاض. يبدو أن الرسم البياني يشير إلى أن
327000 عملية إجهاض أكبر في القيمة الكامنة من 935573 فحصًا للسرطان. ومع ذلك ، فإن الفحص الدقيق سيكشف أن الرسم البياني لا يحتوي
على محور ص محدد. هذا يعني أنه لا يوجد مبرر محدد لوضع
خطوط القياس المرئية.
قام موقع Politifact ، وهو موقع مناصرة للتحقق من الحقائق ، بمراجعة أرقام النائب تشافيتز عبر مقارنة مع التقارير السنوية لمنظمة
تنظيم الأسرة. باستخدام مقياس محدد بوضوح ، إليك ما
تبدو عليه المعلومات:
ومثل هذا بمقياس صالح آخر:
بمجرد وضعه ضمن نطاق محدد بوضوح ، يصبح من الواضح أنه في حين
أن عدد فحوصات السرطان قد انخفض في الواقع ، إلا أنه لا يزال يفوق عدد إجراءات
الإجهاض التي يتم إجراؤها سنويًا. على هذا النحو ، يعد هذا مثالًا
إحصائيًا مضللًا كبيرًا ، وقد يجادل البعض بالتحيز بالنظر إلى أن الرسم البياني لم
ينشأ من عضو الكونجرس ، ولكن من منظمة أمريكيون متحدون من أجل الحياة ، وهي مجموعة
مناهضة للإجهاض. هذا مجرد مثال واحد من العديد من
الأمثلة على الإحصائيات المضللة في الإعلام والسياسة.
·
إحصائيات مضللة في الإعلان
في عام 2007 ، أمرت هيئة معايير الإعلان
(ASA) في المملكة المتحدة شركة كولجيت
بالتخلي عن مطالبتها: "أكثر من 80٪ من أطباء الأسنان يوصون بشركة كولجيت". تم وضع الشعار المعني على لوحة إعلانية في المملكة المتحدة ،
واعتُبر أنه ينتهك قواعد الإعلان في المملكة المتحدة.
تم العثور على هذا الادعاء ، الذي استند إلى استطلاعات رأي
أطباء الأسنان وخبراء حفظ الصحة التي أجرتها الشركة المصنعة ، على أنه تحريف لأنه
سمح للمشاركين باختيار علامة تجارية واحدة أو أكثر من معجون الأسنان. ذكرت ASA أن الادعاء "... سيفهمه القراء
على أنه يعني أن 80 في المائة من أطباء الأسنان يوصون بشركة كولجيت أكثر من
العلامات التجارية الأخرى ، وأن الـ 20 في المائة المتبقية يوصون بماركات مختلفة."
تابع ASA ، "نظرًا لأننا أدركنا أن علامة تجارية
منافسة أخرى قد تمت التوصية بها تقريبًا مثل العلامة التجارية Colgate من قبل أطباء الأسنان الذين شملهم الاستطلاع ، فقد خلصنا إلى
أن الادعاء المضلل ضمنيًا أن 80 بالمائة من أطباء الأسنان يوصون بمعجون أسنان Colgate بدلاً من جميع العلامات التجارية الأخرى." زعمت
ASA أيضًا أن النصوص المستخدمة في المسح
أبلغت المشاركين أن البحث تم إجراؤه بواسطة شركة أبحاث مستقلة ، وهو أمر خاطئ
بطبيعته.
استنادًا إلى أساليب إساءة الاستخدام التي غطيناها ، من الآمن
أن نقول إن هذه التقنية غير اليدوية الخادعة من قبل شركة كولجيت هي مثال واضح على
الإحصائيات المضللة في الإعلانات ، وستندرج في إطار الاقتراع الخاطئ والتحيز
الصريح.
·
الإحصاء المضلل في العلوم
مثل الكثير من الإجهاض ، فإن الاحتباس الحراري هو موضوع مشحون
سياسيًا آخر من المحتمل أن يثير المشاعر. ويصادف أيضًا أنه موضوع يتم تأييده
بقوة من قبل كل من المعارضين والمؤيدين عبر الدراسات. دعونا نلقي نظرة على بعض الأدلة
المؤيدة والمعارضة.
من المتفق عليه عمومًا أن متوسط درجة الحرارة العالمية في
عام 1998 كان 58.3 درجة فهرنهايت. هذا وفقًا لمعهد
جودارد لدراسات الفضاء التابع لناسا . في عام 2012 ، تم قياس متوسط درجة
الحرارة العالمية عند 58.2 درجة. لذلك ، يجادل معارضو الاحتباس الحراري
بأنه ، نظرًا لحدوث انخفاض بنسبة 0.1 درجة في متوسط درجة الحرارة العالمية خلال
فترة 14 عامًا ، فإن ظاهرة الاحتباس الحراري تم دحضها.
الرسم البياني أدناه هو الرسم البياني الأكثر استخدامًا لدحض
ظاهرة الاحتباس الحراري. يوضح التغير في درجة حرارة الهواء
(مئوية) من 1998 إلى 2012.
ومن الجدير بالذكر أن عام 1998 كان من أكثر الأعوام سخونة على
الإطلاق بسبب تيار رياح النينيو القوي بشكل غير طبيعي. وتجدر الإشارة أيضًا إلى أنه نظرًا
لوجود درجة كبيرة من التباين داخل النظام المناخي ، يتم قياس درجات الحرارة عادةً
بدورة مدتها 30 عامًا على الأقل. يعبر الرسم البياني أدناه عن التغيير
لمدة 30 عامًا في متوسط درجات الحرارة العالمية.
والآن ألق نظرة على الاتجاه من عام 1900 إلى عام 2012:
في حين أن البيانات طويلة المدى قد تبدو وكأنها تعكس مرحلة
استقرار ، إلا أنها ترسم بوضوح صورة الاحترار التدريجي. لذلك ، فإن استخدام الرسم البياني
الأول ، والرسم البياني الأول فقط ، لدحض ظاهرة الاحتباس الحراري هو مثال إحصائي
مضلل مثالي.
كيف تقرأ الإحصائيات عن بعد
سيكون أول شيء جيد بالطبع هو الوقوف أمام استبيان / تجربة /
بحث صادق - اختر ما لديك تحت عينيك - والذي طبق التقنيات الصحيحة لجمع البيانات
وتفسيرها . لكن لا يمكنك أن تعرف حتى تسأل نفسك
بضعة أسئلة وتحلل النتائج بين يديك.
بصفتك رائد أعمال ومستشار سابق مارك سوستر ينصح
في مقال ، يجب أن تتساءل عمن أجرى البحث الأساسي
للتحليل المذكور. مجموعة دراسة جامعية مستقلة ، فريق
بحثي تابع للمختبر ، شركة استشارية؟ من هناك ينبع بطبيعة الحال السؤال: من
دفع لهم؟ نظرًا لأنه لا يوجد أحد يعمل مجانًا ،
فمن المثير للاهتمام دائمًا معرفة من يرعى البحث. وبالمثل ، ما هي الدوافع وراء البحث؟ ما الذي حاول العالم أو الإحصائيون اكتشافه؟ أخيرًا ، ما حجم مجموعة العينات ومن كان جزءًا منها؟ ما مدى شمولية ذلك؟
هذه أسئلة مهمة يجب التفكير فيها والإجابة عليها قبل نشر
النتائج المنحرفة أو المنحازة في كل مكان - على الرغم من حدوثها طوال الوقت ، بسبب
التضخيم. غالبًا ما يحدث مثال نموذجي للتضخيم
مع الصحف والصحفيين ، الذين يأخذون قطعة واحدة من البيانات ويحتاجون إلى تحويلها
إلى عناوين رئيسية - وبالتالي غالبًا ما تكون خارج سياقها الأصلي. لا أحد يشتري مجلة حيث تنص على أنه في العام المقبل ، سيحدث
نفس الشيء في سوق XYZ مثل هذا العام - على الرغم من أن هذا
صحيح. المحررين والعملاء والأشخاص يريدون
شيئًا جديدًا وليس شيئًا يعرفونه ؛ لهذا السبب غالبًا ما ينتهي بنا
المطاف بظاهرة تضخيم يتردد صداها وأكثر مما ينبغي.
إساءة استخدام الإحصائيات - ملخص
بالنسبة للسؤال "هل يمكن التلاعب بالإحصاءات؟" ،
يمكننا معالجة 6 طرق غالبًا ما تستخدم - عن قصد أم بغير قصد - والتي تؤدي إلى
انحراف التحليل والنتائج. فيما يلي الأنواع الشائعة لإساءة
استخدام الإحصائيات:
·
الاقتراع الخاطئ
·
الارتباطات المعيبة
·
صيد البيانات
·
تصور البيانات المضللة
·
التحيز الهادف والانتقائي
·
استخدام النسبة المئوية للتغير مع حجم عينة صغير
الآن بعد أن تعرفت عليهم ، سيكون من الأسهل اكتشافهم والتشكيك
في جميع الإحصائيات التي يتم تقديمها لك كل يوم. وبالمثل ، من أجل ضمان الحفاظ على
مسافة معينة من الدراسات والاستطلاعات التي تقرأها ، تذكر الأسئلة التي تطرحها على
نفسك - من الذي قام بالبحث ولماذا ، ومن دفع ثمنه ، وما هي العينة.
الشفافية وحلول الأعمال المبنية على البيانات
في حين أنه من الواضح تمامًا أن البيانات الإحصائية يمكن أن
يساء استخدامها ، إلا أنها يمكن أن تدفع القيمة السوقية أخلاقياً في العالم الرقمي. تتمتع البيانات الضخمة بالقدرة على تزويد الشركات في العصر
الرقمي بخريطة طريق لتحقيق الكفاءة والشفافية ، وفي النهاية الربحية. يمكن للحلول التقنية المتقدمة مثل برنامج إعداد التقارير
عبر الإنترنت أن تعزز نماذج البيانات الإحصائية ،
وتزود الشركات في العصر الرقمي بتصعيد في منافستها.
سواء كان ذلك من أجل معلومات السوق أو تجربة العملاء أو إعداد
التقارير التجارية ، فإن مستقبل البيانات هو الآن. احرص على تطبيق البيانات بشكل مسؤول
وأخلاقي ومرئي ، وشاهد هوية شركتك الشفافة تنمو.
ليست هناك تعليقات:
إرسال تعليق