بحث هذه المدونة الإلكترونية

السبت، 22 أغسطس 2020

المستقبل الهائل لتعليم الإحصاء



البيانات تلتهم العالم ، لكن قدرتنا الجماعية على تحليل البيانات تسير على نظام غذائي يتضورون جوعا.

في كل مكان تتجه إليه ، يتم إنشاء البيانات بطريقة ما. بحلول الوقت الذي تقرأ فيه هذه القطعة ، ربما تكون قد جمعت بعض البيانات. (على سبيل المثال ، تحتوي هذه القطعة على 2072 كلمة). لا يمكنك تجنب البيانات - فهي تأتي من جميع الاتجاهات.

إذن ماذا سنفعل بها؟ بالنسبة للجزء الأكبر ، لا شيء. هناك الكثير من البيانات التي يتم إطلاقها. لكن بالنسبة للبيانات التي نهتم  بها  ، نحتاج إلى معرفة الطرق المناسبة للتفكير فيها وتحليلها. وبكلمة "نحن" ، أعني الجميع تقريبًا.

في المستقبل ، سيحتاج الجميع إلى بعض مهارات تحليل البيانات. يواجه الأشخاص باستمرار البيانات والحاجة إلى اتخاذ خيارات وقرارات من البيانات الأولية التي يتلقونها. تقدم الهواتف معلومات حول حركة المرور ، ولدينا تقييمات حول المطاعم أو الكتب ، وحتى تصنيف المستشفيات. يمكن لطلاب المدارس الثانوية الحصول على معلومات معقدة وغنية عن الكليات التي يتقدمون إليها بينما يمكن للجان القبول الحصول على بيانات في الوقت الفعلي حول اهتمام المتقدمين بالكلية.

يمتلك العديد من الأشخاص بالفعل خوارزميات إرشادية للتعامل مع تدفق البيانات - وقد تخدمهم هذه الخوارزميات بشكل جيد - ولكن ستكون هناك حاجة إلى التفكير الإحصائي الحقيقي في مواقف تتجاوز اختيار المطعم الذي سيحاول تناول العشاء الليلة.

قدرة محدودة

توقع معهد ماكينزي العالمي ، في  تقرير تم الاستشهاد به بشدة ، أنه سيكون هناك نقص في "خبراء البيانات" وأنه بحلول عام 2018 سيكون هناك ما بين 140.000 و 190.000 منصب شاغر في علم البيانات. بالإضافة إلى ذلك ، سيكون هناك ما يقدر بنحو 1.5 مليون شخص في المناصب الإدارية الذين سيحتاجون إلى التدريب لإدارة علماء البيانات وفهم مخرجات تحليل البيانات. إذا كان التاريخ هو أي دليل ، فمن المحتمل أن يتم شغل هذه الوظائف من قبل الأشخاص ، بغض النظر عما إذا كانوا مدربين بشكل صحيح. ستكون العواقب المحتملة كارثية حيث يفسر المحللون غير المدربين البيانات الضخمة المعقدة القادمة من مصادر لا تعد ولا تحصى ذات جودة متفاوتة.

من الذي سيوفر التدريب اللازم لجميع هذه الوظائف الشاغرة؟ إن النظام الحالي لتدريب الأشخاص في مجال الإحصاء وتزويدهم بدرجات الماجستير والدكتوراه غير ملائم على الإطلاق لهذه المهمة. في عام 2013 ، تخرج أكبر 10 برامج للحصول على درجة الماجستير في الإحصاء في الولايات المتحدة ما مجموعه  730 شخصًا . بهذا المعدل ، لن نقوم بتدريب الأشخاص اللازمين أبدًا. بينما استفاد الإحصائيون بشكل كبير من الزيادة المفاجئة والسريعة في كمية البيانات المتدفقة حول العالم ، فإن قدرتنا على توسيع نطاق التدريب اللازم لتحليل تلك البيانات غير موجودة أساسًا.

علاوة على كل هذا ، أعتقد أن تقرير McKinsey هو استخفاف كبير بعدد الأشخاص الذين سيحتاجون إلى تدريبهم على  بعض  مهارات تحليل البيانات في المستقبل. بالنظر إلى كمية البيانات التي يتم إنشاؤها كل يوم ، ومدى أهمية أن يتمكن الجميع من تفسير هذه البيانات بذكاء ، أود أن أزعم أنه من الضروري   أن يكون لدى الجميع بعض مهارات تحليل البيانات. وغني عن القول ، إنه من الحماقة اقتراح أن يحصل الجميع على درجة الماجستير أو حتى البكالوريوس في الإحصاء. نحن بحاجة إلى نهج بديل عالي الجودة وقابل للتطوير لعدد كبير من السكان خلال فترة زمنية قصيرة.

أدخل MOOCs

في أبريل من عام 2014 ، أطلقت أنا وجيف ليك وبريان كافو  تخصص علوم البيانات بجامعة جونز هوبكنز  على منصة كورسيرا. هذه سلسلة من تسع دورات تهدف إلى تقديم تدريب "حسي حتى مكسرات" في علم البيانات للأشخاص الذين لديهم دوافع عالية ولديهم بعض الخلفية الرياضية والحاسوبية الأساسية. يتبع تسلسل الدورات التسع ما نعتقد أنه "عملية علم البيانات" الأساسية ، وهي

صياغة سؤال يمكن الإجابة عليه بالبيانات
تجميع وتنظيف وترتيب البيانات ذات الصلة بالسؤال
استكشاف البيانات والتحقق منها واستبعاد الفرضيات
تطوير نموذج إحصائي
صنع الاستدلال الإحصائي
توصيل النتائج
جعل العمل قابلاً للتكرار
اتخذنا هذه الخطوات الأساسية وصممنا دورات حول كل منها.

يتم تقديم كل دورة تدريبية بتنسيق مفتوح هائل عبر الإنترنت ، مما يعني أن عدة آلاف من الأشخاص يلتحقون عادةً بكل دورة في كل مرة يتم تقديمها. يقوم المتعلمون في الدورات بعمل واجبات منزلية ، ويأخذون الاختبارات ، ويقيم الأقران عمل الآخرين في الفصل. يتم التعامل مع جميع الدرجات والتقييمات تلقائيًا بحيث يمكن للعملية توسيع نطاق التسجيلات الكبيرة بشكل تعسفي. على سبيل المثال ، تم تسجيل ما يقرب من 45000 متعلم في جلسة أبريل 2015 لدورة البرمجة R. كل فصل مدته 4 أسابيع بالضبط وكل فصل يعمل كل شهر.
لقد طورنا هذا التسلسل من الدورات جزئيًا لتلبية الطلب المتزايد على تدريب وتعليم علوم البيانات في جميع أنحاء العالم. كانت خلفيتنا كإحصائيين حيويين متوافقة بشكل وثيق مع الاحتياجات التدريبية للأشخاص المهتمين بعلوم البيانات لأن علم البيانات هو  ما نقوم به كل يوم . في الواقع ، كانت إحدى قواعد المنهج التي كانت لدينا هي أنه لا يمكننا تضمين شيء ما إذا لم نستخدمه في الواقع في عملنا.
يحتوي التسلسل على قدر كبير من محتوى الإحصائيات القياسي ، مثل الاحتمال والاستدلال ، والنماذج الخطية ، والتعلم الآلي. يحتوي أيضًا على محتوى غير قياسي ، مثل git و GitHub و R program و Shiny و Markdown. يغطي التسلسل معًا مجموعة كاملة من الأدوات التي نعتقد أنها ستكون مطلوبة من قبل عالم البيانات الممارس.
بالنسبة لأولئك الذين أكملوا الدورات التسع ، هناك مشروع تتويجا في النهاية ، يتضمن أخذ جميع المهارات في الدورة وتطوير منتج بيانات. في مشروعنا الأول ، عقدنا شراكة مع  SwiftKey ، وهي شركة تحليلات نصية تنبؤية ، لتطوير مشروع حيث كان على المتعلمين بناء نموذج إحصائي للتنبؤ بالكلمات في جملة. يتضمن هذا المشروع أخذ بيانات غير منظمة وفوضوية ومعالجتها في شكل قابل للتحليل وتطوير نموذج إحصائي أثناء إجراء المفاضلات من أجل الكفاءة والدقة وإنشاء تطبيق لامع لعرض نموذجهم للجمهور.
بدائل الدرجة
تخصص علوم البيانات ليس برنامج درجة رسمي تقدمه جامعة جونز هوبكنز - المتعلمون الذين يكملون التسلسل لا يحصلون على أي ائتمان من جامعة جونز هوبكنز - ولذا قد يتساءل المرء عما يحصل عليه المتعلمون من البرنامج (إلى جانب بالطبع ، المعرفة نفسها). بادئ ذي بدء ، يعتمد التسلسل على الحافظة بالكامل ، لذلك يكمل المتعلمون المشاريع التي يمكن للآخرين مشاهدتها على الفور. يسمح هذا للآخرين بتقييم قدرة المتعلم على الفور باستخدام رمز حقيقي أو تحليل بيانات.
محتوى المحاضرة متاح بشكل مفتوح ومستضاف على GitHub ، حتى يتمكن الاشخاص من عرض المحتوى ورؤية ما يتم تدريسه بأنفسهم. وهذا يمنحهم
فرصة لتقييم البرنامج مباشرة بدلاً من الاضطرار إلى الاعتماد على السمعة الممتازة للمؤسسة التي تدرس الدورات.
يمكن لكل متعلم يكمل دورة تدريبية باستخدام "Signature Track" من Coursera (والذي يكلف حاليًا 49 دولارًا لكل دورة) الحصول على شارة على ملفه الشخصي على LinkedIn ، مما يدل على أنه قد أكمل الدورة. يمكن أن يكون هذا غالبًا بنفس قيمة الدرجة العلمية أو أي شهادة أخرى حيث سيتمكن القائمون بالتوظيف الذين يجوبون LinkedIn للحصول على مناصب علماء البيانات من رؤية شهادات المكملين لدينا في دورات علوم البيانات المختلفة.

أخيرًا ، يؤدي حجم تخصصنا ومدى انتشاره إلى إنشاء شبكة اجتماعية كبيرة للخريجين يمكن للمتعلمين الاستفادة منها. اعتبارًا من مارس 2015 ، كان هناك ما يقرب من 700000 شخص درسوا دورة واحدة على الأقل في التخصص. يتمتع هؤلاء 700000 شخص بتجربة مشتركة ، رغم أنها ليست بمستوى التعليم الجامعي ، إلا أنها لا تزال مفيدة في إقامة روابط بين الناس ، خاصة عندما يبحث الناس عن وظائف.

الأعداد المبكرة

كان التسلسل ناجحًا للغاية حتى الآن. بلغ متوسط ​​عدد المسجلين في الشهر 182.507 في الشهر للسنة الأولى في الوجود. كان المعدل الإجمالي لإتمام الدورة حوالي 6٪ ومعدل إتمام الدورة بين من هم في "مسار التوقيع" (أي الملتحقون بأجر) كان 67٪. في أكتوبر 2014 ، بالكاد 7 أشهر منذ بدء التخصص ، كان لدينا 663 متعلمًا مسجلين في مشروع التخرج.

بعض الدروس المبكرة

من تشغيل تخصص علوم البيانات لأكثر من عام الآن ، تعلمنا عددًا من الدروس ، بعضها كان غير متوقع. هنا ، ألخص النقاط البارزة لما تعلمناه.

علم البيانات كفن وعلم. ومن المفارقات ، على الرغم من ظهور كلمة "علم" في اسم "علم البيانات" ، إلا أنه يوجد في الواقع قدر كبير من المعلومات حول ممارسة علم البيانات التي لا تشبه العلم على الإطلاق. إن الكثير مما يفعله الإحصائيون في عملية تحليل البيانات هو أمر بديهي ومخصص ، حيث يُنظر إلى كل تحليل بيانات على أنه زهرة فريدة.

عند محاولة تصميم مهام تحليل البيانات التي يمكن تصنيفها على نطاق واسع مع عشرات الآلاف من الأشخاص ، اكتشفنا أن تصميم القواعد لتقدير هذه المهام لم يكن تافهًا. والسبب هو أن فهمنا لما يجعل التحليل "الجيد" مختلفًا عن التحليل السيئ ليس مفصلاً جيدًا. لم نتمكن من تحديد أي فهم على مستوى المجتمع المحلي لمكونات التحليل الجيد. ما هي الأساليب "الصحيحة" لاستخدامها في حالة تحليل بيانات معينة؟ ما هو بالتأكيد النهج "الخاطئ"؟

على الرغم من أن كل واحد منا كان يقوم بتحليل البيانات في الجزء الأكبر من عقد من الزمان ، لم يستطع أي منا أن يكتب بإيجاز ماهية العملية وكيفية التعرف عليها عندما تم القيام بها بشكل خاطئ. لإعادة صياغة صياغة داريل بريجيبون من حديثه عام 1991 في الأكاديميات الوطنية للعلوم ، كان لدينا عملية اعتنقناها  بانتظام ولكننا بالكاد نفهمها.

المحتوى مقابل التنظيم .  يتوفر الكثير من المحتوى الذي نضعه على الإنترنت في مكان آخر. باستخدام YouTube ، يمكنك العثور على مقاطع فيديو عالية الجودة حول أي موضوع تقريبًا ، ومقاطع الفيديو الخاصة بنا ليست أفضل بكثير. علاوة على ذلك ، فإن الموضوع الذي كنا ندرسه أصبح الآن ملكية. النماذج الخطية التي نعلمها هي نفس النماذج الخطية التي يتم تدريسها في كل مكان آخر. إذن ما هي القيمة التي كنا نقدمها بالضبط؟

يتطلب البحث على YouTube أن تعرف ما الذي تبحث عنه. هذه مشكلة للأشخاص الذين يدخلون منطقة ما. على نحو فعال ، ما قدمناه كان  تنظيمًا  لكل المعارف الموجودة حول موضوع علم البيانات (أضفنا أيضًا دوراننا الملتوي). التنظيم صعب ، لأنك تحتاج إلى اتخاذ خيارات محددة بين ما هو عنصر أساسي في مجال ما وما لا يمثله. لكن التنظيم ضروري لتعلم مجال للمبتدئين.

مجموعات المهارات مقابل الشهادة . نظرًا لأننا علمنا أننا لم نطور برنامجًا حقيقيًا للحصول على درجة علمية ، فقد علمنا أنه يتعين علينا تطوير البرنامج بطريقة تمكن المتعلمين من رؤية القيمة التي يحصلون عليها منه بسرعة بأنفسهم. يقودنا هذا إلى اتباع نهج المحفظة حيث ينتج المتعلمون أشياء يمكن عرضها بشكل عام.

جزئيًا بسبب الاختيار الذاتي للسكان الذين يسعون إلى تعلم مهارات علوم البيانات ، كان المتعلمون لدينا أكثر اهتمامًا بالقدرة على إظهار المهارات التي يتم تدريسها في الدورة بدلاً من الحصول على شهادة مجردة (ولكن رسمية) كما يمكن الحصول عليها في إحدى الشهادات برنامج. هذا لا يختلف عن الذهاب إلى معهد كونسرفتوار للموسيقى ، حيث يكون الإخراج هو قدرتك على العزف على آلة بدلاً من قطعة الورق التي تتلقاها عند التخرج. نشعر أن إعطاء الناس القدرة على إظهار المهارات ومجموعات المهارات ربما يكون أكثر أهمية من الشهادات الرسمية في بعض الحالات لأنه يمنح أصحاب العمل إحساسًا ملموسًا بما يمكن للشخص القيام به.

الاستنتاجات

اعتبارًا من أبريل 2015 ، كان لدينا ما مجموعه 1158 متعلمًا أكملوا التخصص بأكمله ، بما في ذلك مشروع التخرج. بالنظر إلى هذه الأرقام ومعدل إتمامنا للتخصص ككل ، نعتقد أننا في طريقنا لتحقيق هدفنا المتمثل في إنشاء برنامج قابل للتطوير بدرجة عالية لتدريب الأشخاص على مهارات علوم البيانات. بالطبع ، لن يكون هذا البرنامج وحده كافياً لجميع احتياجات التدريب على علوم البيانات للمجتمع. لكننا نعتقد أن النهج الذي اتخذناه ، باستخدام قنوات MOOC غير القياسية ، والتركيز على مجموعات المهارات بدلاً من الشهادات ، والتأكيد على دورنا في التنظيم ، هو فرصة غنية لاستكشاف مجال الإحصاء من أجل تثقيف الجماهير حول عملنا المهم.



لطلب تحليل احصائي التواصل عبر الواتسب اضغط هنا

ليست هناك تعليقات:

إرسال تعليق

مجالات الإرشاد النفسي المدرسي

  مجالات الإرشاد النفسي المدرسي   مقدمة: هناك العديد من مجالات الخدمة النفسية المتنوعة، فمنها إرشاد الأطفال، وإرشاد المراهقين، وإرشاد ...