بحث هذه المدونة الإلكترونية

السبت، 22 أغسطس 2020

الفرق بين تحليل البيانات والتحليل الإحصائي



قبل خمسين عامًا ، كانت الخطوط الفاصلة بين "تحليل البيانات" و "التحليل الإحصائي" واضحة تمامًا. ولكن مع تطور تحليل البيانات ، أصبحت هذه الخطوط غير واضحة. أصبحت الاختلافات بين المصطلحين الآن منطقة رمادية إلى حد كبير ، ولكن لا تزال هناك بعض الاختلافات الملحوظة.

ما هو "تحليل البيانات"؟
يعرّف علماء البيانات والإحصائيون عادةً "تحليل البيانات" بطرق مختلفة.

بالنسبة لعالم البيانات ، يقوم تحليل البيانات بغربلة كميات هائلة من البيانات: فحصها وتطهيرها ووضع نماذج لها وتقديمها بطريقة غير تقنية إلى علماء غير معتمدين على البيانات. يتم تنفيذ الغالبية العظمى من تحليل البيانات هذا على جهاز كمبيوتر.
إذا كنت إحصائيًا ، فبدلاً من "كميات هائلة من البيانات" ، سيكون لديك عادةً كمية محدودة من المعلومات في شكل عينة (أي جزء من السكان) ؛ يتم إجراء تحليل البيانات على هذه العينة باستخدام تقنيات إحصائية صارمة.
يستخدم كل من علماء البيانات والإحصائيين البيانات لعمل استنتاجات حول مجموعات المستهلكين أو عامة السكان أو السوق المستهدفة. ومع ذلك ، سوف يتعاملون مع مسألة تحليل البيانات بشكل مختلف تمامًا.

A محلل البيانات  سيكون لها الأدوات العلمية البيانات (مثل لغات البرمجة مثل بيثون وR، أو تجربة مع الأطر مثل Hadoop وسبارك أباتشي) التي يمكنهم من خلالها تحقيق في الاستدلالات البيانات وجعل.
من ناحية أخرى، وهو الإحصائي  المحلل  سوف تستخدم عادة تقنيات رياضية القائم على مثل اختبار الفرضيات ، احتمال  ومختلف النظريات الإحصائية لجعل الاستدلالات. ورغم أن الكثير من تحليل البيانات والإحصاءات، لا يمكن أن يؤديها مع مساعدة من البرامج الإحصائية مثل R، والتحليل هو أكثر منهجية وتستهدف فهم جانب واحد معين من عينة في وقت واحد (على سبيل المثال، يعني ، الانحراف المعياري أو فترة الثقة ) .
تعد  دورة حياة البيانات  أساسية لسير عمل البيانات في علم البيانات:
يمكنك إجراء العديد من خطوات تحليل البيانات في علم البيانات مع القليل من الأساس الإحصائي: إعداد البيانات ، وتحويل البيانات.

ما هو التحليل الإحصائي؟
بشكل عام ، التحليل الإحصائي هو علم الكشف عن الأنماط والاتجاهات في البيانات باستخدام الإحصاء . لاحظ أن الكلمة الأساسية هنا هي "الإحصائيات" . من أجل إجراء أي تحليل إحصائي على الإطلاق ، عليك استخدام الإحصائيات. تاريخيًا ، استخدم الإحصائيون فقط الأساليب الإحصائية في البيانات. ولم يكن علم البيانات شيئًا حتى في أيام الأجهزة المركزية لتثبيت الأشرطة وبرمجة كوبول. ولكن مع تطور علم البيانات ، فقد امتزج مع العديد من المجالات التي كان يُعتقد أنها المجال الحصري للإحصائي: تصور البيانات ، والتحسين ، والتحليل عالي الأبعاد على سبيل المثال لا الحصر.
تحليل البيانات مقابل التحليل الإحصائي
هناك منطقة رمادية كبيرة:  تحليل البيانات جزء من التحليل الإحصائي ، والتحليل الإحصائي جزء من تحليل البيانات. سيكون لدى أي محلل بيانات مختص فهم جيد للأدوات الإحصائية وسيكون لدى بعض الإحصائيين بعض الخبرة في لغات البرمجة مثل R.

إذا كنت محتارًا بشأن مكان الخط أو مكان حدوث هذا الفصل ، فإن السؤال الأساسي هو حقًا ،

هل حقلا علم البيانات والإحصاء كيانان منفصلان حقًا؟

في طريقة التفكير في "المدرسة القديمة" حول الإحصاء (أي ، يقوم الإحصائي ذو الشعر الرمادي بالخربشة في غلاف ، ويفحص الجداول ويؤدي اختبارات فرضية غامضة يفهمها القليل) مقابل علم البيانات (مثير ، في طليعة الثورة التكنولوجية) ، إذن يمكنك القول نعم ، إنهما منفصلان تمامًا. ومع ذلك ، إذا كنت تعتقد أن الإحصائيات الحديثة تدور حول  "... الفكرة الأوسع لعلم البيانات الأكبر (على سبيل المثال من خلال التركيز بشكل أكبر على الحساب في التعليم والبحث والاتصال)"  (كارمايكل ومارون ، 2018) ، فإن الجواب ربما لا.

PATH) التنبؤية نهج لمعالجة تأثير عدم التجانس) مبادئ الخطوط العريضة بيان والمعايير والاعتبارات الرئيسية لتطبيق النهج التنبؤية إلى التجارب السريرية لتقديم أدلة المريض محورها في دعم اتخاذ القرارينصب تركيز PATH على نمذجة "عدم تجانس تأثير العلاج" ( HTE ) ، والذي يشير إلى التباين غير العشوائي في حجم تأثير العلاج المطلق"فائدة العلاج" ) عبر المرضى الأفرادتعريف أكثر تركيزًا هو أن HTE يشير إلى تباين تأثير العلاج على مقياس من الممكن أنه لا يوجد مثل هذا الاختلاف ، حتى لو كان للعلاج تأثير غير صفري على المتوسط.
يسرد بيان المسار الأخير عددًا من المبادئ والإرشاداتالمبدأ الأساسي في الشكل 2 :
"من المرجح أن يكون نهج نمذجة المخاطر لتحليل المضبوطة ذات قيمة كبيرة عندما يكون تأثير العلاج الشامل راسخًا ؛ يجب تفسير نتائج المجموعة الفرعية (بما في ذلك نتائج المجموعات الفرعية القائمة على المخاطر) من التجارب الشاملة الخالية من الأخطاء بحذر. "
أنا هنا أناقش كيف نؤسس "تأثير العلاج الشامل" . أكرر بعض النتائج والبيانات من الأوراق الكلاسيكية لصالح التعديل المتغير باعتباره التحليل الرئيسي.
رسم توضيحي في محاكمة GUSTO-I
للتوضيح ، قد نقوم بتحليل 30،510 مريضًا يعانون من احتشاء عضلة القلب الحاد على النحو الوارد في تجربة GUSTO-I. يبدأ هذا الرسم التوضيحي كمدونة كتبها فرانك هاريل حول فحص HTE .



لطلب تحليل احصائي التواصل عبر الواتسب اضغط هنا

ليست هناك تعليقات:

إرسال تعليق

مجالات الإرشاد النفسي المدرسي

  مجالات الإرشاد النفسي المدرسي   مقدمة: هناك العديد من مجالات الخدمة النفسية المتنوعة، فمنها إرشاد الأطفال، وإرشاد المراهقين، وإرشاد ...