بحث هذه المدونة الإلكترونية

السبت، 22 أغسطس 2020

الثقافات الفرعية لتحليل البيانات



أنا و روجر رددنا على الجدل الدائر حول المجلة التي حظرت قيم p اليوم في Nature.  قطعة مثل هذه تتطلب الكثير من المعلومات معبأة في مساحة صغيرة جدًا ، لكنني اعتقدت أن فكرة واحدة تستحق الحديث عنها أكثر كانت فكرة الثقافات الفرعية لتحليل البيانات. من الورق:

يتم تدريس تحليل البيانات من خلال نموذج التلمذة الصناعية ، وتقوم مختلف التخصصات بتطوير ثقافات التحليل الفرعية الخاصة بها. تستند القرارات إلى الأعراف الثقافية في مجتمعات محددة بدلاً من الأدلة التجريبية. على سبيل المثال ، يطلق الاقتصاديون على البيانات المقاسة بمرور الوقت "بيانات لوحة" ، والتي يطبقون عليها بشكل متكرر نماذج التأثيرات المختلطة. يشير علماء الطب الحيوي إلى نفس النوع من بنية البيانات مثل "البيانات الطولية" ، وغالبًا ما يتعاملون معها مع معادلات التقدير المعممة.

أعتقد أن هذا هو أحد المكونات الأقل تقديرًا لتحليل البيانات الحديثة. يتم تدريس تحليل البيانات بالكامل تقريبًا من خلال ثقافة التدريب المهني مع سلوكيات مختلفة تمامًا يتم تدريسها في تخصصات مختلفة. تتفق كل هذه التخصصات على المثلى الرياضي لطرق معينة في ظل ظروف محددة للغاية. لهذا السبب ترى طرقًا  مثل التجارب العشوائية [روجر وأنا رددت على الجدل الدائر حول المجلة التي حظرت قيم p اليوم في Nature.  قطعة مثل هذه تتطلب الكثير من المعلومات معبأة في مساحة صغيرة جدًا ، لكنني اعتقدت أن فكرة واحدة تستحق الحديث عنها أكثر كانت فكرة الثقافات الفرعية لتحليل البيانات. من الورق:

يتم تدريس تحليل البيانات من خلال نموذج التلمذة الصناعية ، وتقوم مختلف التخصصات بتطوير ثقافات التحليل الفرعية الخاصة بها. تستند القرارات إلى الأعراف الثقافية في مجتمعات محددة بدلاً من الأدلة التجريبية. على سبيل المثال ، يطلق الاقتصاديون على البيانات المقاسة بمرور الوقت "بيانات لوحة" ، والتي يطبقون عليها بشكل متكرر نماذج التأثيرات المختلطة. يشير علماء الطب الحيوي إلى نفس النوع من بنية البيانات مثل "البيانات الطولية" ، وغالبًا ما يتعاملون معها مع معادلات التقدير المعممة.

أعتقد أن هذا هو أحد المكونات الأقل تقديرًا لتحليل البيانات الحديثة. يتم تدريس تحليل البيانات بالكامل تقريبًا من خلال ثقافة التدريب المهني مع سلوكيات مختلفة تمامًا يتم تدريسها في تخصصات مختلفة. تتفق كل هذه التخصصات على المثلى الرياضي لطرق معينة في ظل ظروف محددة للغاية. لهذا السبب ترى طرقًا  مثل

ولكن أي تحليل حقيقي للبيانات هو دائمًا عملية متعددة الخطوات تتضمن تنظيف البيانات وترتيبها ، والتحليل الاستكشافي ، وتركيب النموذج وفحصه ، والتلخيص ، والتواصل. إذا أعطيت شخصًا ما من الاقتصاد والإحصاء الحيوي والإحصاء والرياضيات التطبيقية مجموعة بيانات متطابقة ، فسيعيدون لك  تقارير مختلفة جدًا عما فعلوه ، ولماذا فعلوه ، وما يعنيه كل ذلك. فيما يلي بعض الأمثلة التي يمكنني التفكير بها من أعلى رأسي:

يستدعي علم الاقتصاد بيانات لوحة البيانات الطولية ويستخدم في الغالب نماذج التأثيرات المختلطة الخطية ، بينما تعد معادلات التقدير المعممة أكثر شيوعًا في الإحصاء الحيوي (هذا هو المثال من روجر / ورقي).
في دراسات الارتباط الواسع للجينوم ، يعد معدل الخطأ العائلي هو معدل الخطأ الأكثر شيوعًا للتحكم. في دراسات التعبير الجيني ، كثيرًا ما يستخدم الناس معدل الاكتشاف الخاطئ.
هذا يتغير قليلاً ، ولكن إذا تعلمت الإحصاء في Duke فأنت على الأرجح بايزي وإذا تعلمت في بيركلي فأنت على الأرجح متكرر.
علم النفس له تاريخ في استخدام الإحصائيات البارامترية ، والجينوميات كبيرة في التجريبية بايز ، وترى الكثير من إحصائيات بايز في دراسات المناخ .




لطلب تحليل احصائي التواصل عبر الواتسب اضغط هنا

ليست هناك تعليقات:

إرسال تعليق

مجالات الإرشاد النفسي المدرسي

  مجالات الإرشاد النفسي المدرسي   مقدمة: هناك العديد من مجالات الخدمة النفسية المتنوعة، فمنها إرشاد الأطفال، وإرشاد المراهقين، وإرشاد ...