التكرار والتأكيد مفاهيم لا غنى عنها تساعد في تحديد الحقائق العلمية. ومع ذلك ، فإن الطريقة التي نتوصل بها إلى إجماع علمي على نتيجة معينة معقدة نوعًا ما. على الرغم من أن بعض البيانات الصحفية تحاول إقناعنا بخلاف ذلك، نادرًا ما يكفي منشور واحد في الواقع ، تمر معظم النتائج المنشورة دون أن يلاحظها أحد ولا توجد محاولات لتكرارها. هذه لم يتم فضحها أيضًا ؛ يتم التخلص منها ببساطة في سلة مهملات التاريخ. يتم تقييم النتائج القليلة جدًا التي تحظى باهتمام كافٍ للآخرين لقضاء الوقت والطاقة عليها من خلال عملية مخصصة تشمل مجتمعًا من الأقران. عادة ما تكون التقييمات عبارة عن مزيج من التفكير الاستنتاجي ، والمحاولات المباشرة للنسخ المتماثل ، والفحوصات غير المباشرة التي يتم الحصول عليها من خلال محاولة البناء على النتيجة المعنية. تؤدي هذه العملية في النهاية إلى قبول نتيجة إما بتوافق الآراء أو لا. بالنسبة للحالات ذات الأهمية الخاصة ، قد يتم إصدار تقرير إجماع علمي رسمي بتكليف من أكاديمية وطنية أو جمعية علمية قائمة. تشمل الأمثلة على النتائج التي أصبحت جزءًا من الإجماع العلمي بهذه الطريقة التدخين المسبب لسرطان الرئة ، وفيروس نقص المناعة البشرية المسبب للإيدز ، وتغير المناخ الذي يسببه الإنسان. في المقابل ، فإن النتيجة المنشورة بأن اللقاحات تسبب التوحد قد تم فضحها بدقة من خلال العديد من دراسات المتابعة. في أي من هذه الحالات الأربع ، تم استخدام تعريف بسيط للنسخ المتماثل لتأكيد أو تزوير نتيجة. وينطبق الشيء نفسه على معظم النتائج التي يوجد إجماع عليها. ومع ذلك ، يتقدم العلم ، ولا يزال قوة لا تضاهى في تحسين نوعية حياتنا. في أي من هذه الحالات الأربع ، تم استخدام تعريف بسيط للنسخ المتماثل لتأكيد أو تزوير نتيجة. وينطبق الشيء نفسه على معظم النتائج التي يوجد إجماع عليها. ومع ذلك ، يتقدم العلم ، ولا يزال قوة لا تضاهى في تحسين نوعية حياتنا. في أي من هذه الحالات الأربع ، تم استخدام تعريف بسيط للنسخ المتماثل لتأكيد أو تزوير نتيجة. وينطبق الشيء نفسه على معظم النتائج التي يوجد إجماع عليها. ومع ذلك ، يتقدم العلم ، ولا يزال قوة لا تضاهى في تحسين نوعية حياتنا.
الوكالات التنظيمية ، مثل
إدارة الغذاء والدواء ، هي مستثناه لأنها توضح بوضوح تعريف التكرار. على سبيل المثال ، للموافقة
على دواء ما ، قد يتطلب الأمر تجربتين سريريتين مستقلتين ، مدعومين بشكل كافٍ ،
لإظهار أهمية إحصائية عند مستوى محدد مسبقًا. كما أنها تتطلب حجم تأثير
كبير بما يكفي لتبرير التكلفة والمخاطر المحتملة المرتبطة بالعلاج. هذا لا يعني أن موافقة إدارة
الغذاء والدواء تعادل الإجماع العلمي ، لكنها تقدم تعريفًا واضحًا للتكرار.
استجابةً للقلق المتزايد
بشأن أزمة إعادة الإنتاج ، بدأت مشاريع مثل Open
Science Collaboration في محاولة منهجية لتكرار
النتائج المنشورة. في منشور حديث ،
وصف جيف إحدى أوراقهم الأخيرة على تقدير استنساخ العلوم
النفسية (إنها تعني حقًا قابلية التكرار ؛ انظر الملاحظة أدناه). أدت هذه الورقة العلمية إلى
نشر تقارير صحفية بعناوين ملفتة للنظر مثل "36٪ فقط من تجارب علم النفس تتكرر". لاحظ أن الرقم 36٪ يأتي من
تعريف التكرار الذي يحاكي التعريف المستخدم من قبل الهيئات التنظيمية: تعتبر
النتائج مكررة إذا تم الوصول إلى قيمة 0.05 في كل من الدراسة الأصلية
والدراسة المنسوخة. لسوء الحظ ، يتجاهل هذا التعريف كلاً من حجم
التأثير والقوة الإحصائية. إذا لم يتم التحكم في القوة ، فإن النسبة
المتوقعة من النتائج الصحيحة التي يتم تكرارها يمكن أن تكون صغيرة جدًا. على سبيل المثال ، إذا حاولت
تكرار نتيجة التدخين - أسباب - سرطان الرئة بحجم عينة من 5 ، فهناك فرصة جيدة لعدم
تكرارها. في منصبه ، يلاحظ جيف أنه في العديد من
الدراسات التي لم تتكرر ، تقاطعت فترات الثقة 95٪. فهل يجب أن تكون فترات الثقة
المتقاطعة هي تعريفنا للتكرار؟ هذا أيضًا به عيب لأنه يفضل الدراسات غير
الدقيقة مع فترات ثقة كبيرة جدًا. إذا تم تجاهل حجم التأثير ، فقد نضيع وقتنا في
محاولة تكرار الدراسات التي تبلغ عن نتائج بلا معنى عمليًا. إن تحديد النسخ المتماثل
للدراسات المنشورة ليس سهلاً مثل التجارب السريرية شديدة الضبط. ومع ذلك ، فإن أحد التحسينات
الواضحة مما يتم إجراؤه حاليًا هو النظر في القوة الإحصائية وأحجام التأثير. فهل يجب أن تكون فترات الثقة
المتقاطعة هي تعريفنا للتكرار؟ هذا أيضًا به عيب لأنه يفضل الدراسات غير الدقيقة
مع فترات ثقة كبيرة جدًا. إذا تم تجاهل حجم التأثير ، فقد نضيع وقتنا في
محاولة تكرار الدراسات التي تبلغ عن نتائج بلا معنى عمليًا. إن تحديد النسخ المتماثل
للدراسات المنشورة ليس سهلاً مثل التجارب السريرية شديدة الضبط. ومع ذلك ، فإن أحد التحسينات
الواضحة مما يتم إجراؤها حاليًا هو النظر في القوة الإحصائية وأحجام التأثير. فهل يجب أن تكون فترات الثقة
المتقاطعة هي تعريفنا للتكرار؟ هذا أيضًا به عيب لأنه يفضل الدراسات غير
الدقيقة مع فترات ثقة كبيرة جدًا. إذا تم تجاهل حجم التأثير ، فقد نضيع وقتنا في
محاولة تكرار الدراسات التي تبلغ عن نتائج بلا معنى عمليًا. إن تحديد النسخ المتماثل
للدراسات المنشورة ليس سهلاً مثل التجارب السريرية شديدة الضبط. ومع ذلك ، فإن أحد التحسينات
الواضحة مما يتم إجراؤه حاليًا هو النظر في القوة الإحصائية وأحجام التأثير.
لتوضيح هذا بشكل أكبر ، دعنا
نفكر في مثال ملموس للغاية مع عواقب الحياة الواقعية. تخيل أن أحد أفراد أسرتك
يعاني من مرض مع معدلات وفيات عالية ويطلب منك المساعدة في تقييم الأدلة العلمية
على العلاجات. تتوفر أربعة عقاقير تجريبية جميعها مع تجارب
سريرية واعدة تؤدي إلى قيم0.05 Pمع ذلك ، فإن مشروع النسخ المتماثل يعيد
التجارب ويجد أن دراسات الدواء A والعقار B فقط هي التي تتكرر (p <0.05). إذن ما هو الدواء الذي
تتناوله؟ دعنا نقدم المزيد من المعلومات لمساعدتك على
اتخاذ القرار. فيما يلي قيم p لكل من التجارب الأصلية
والنسخ المتماثل:
دواء
|
أصلي
|
تكرار
|
منسوخ
|
|
أ
|
0.0001
|
0.001
|
نعم
|
|
ب
|
<0.000001
|
0.03
|
نعم
|
|
ج
|
0.03
|
0.06
|
لا
|
|
د
|
<0.000001
|
0.10
|
لا
|
ما هو الدواء الذي ستتناوله
الآن؟ تستند المعلومات التي قدمتها إلى قيم p وبالتالي تفتقد إلى جزء
أساسي من المعلومات: أحجام التأثير. أعرض أدناه فترات الثقة لجميع الدراسات الأربع
(على اليسار) ودراسات النسخ الأربع (على اليمين). لاحظ أنه باستثناء العقار B ،
تتقاطع جميع فترات الثقة. في ضوء الشكل أدناه ، أيهما ستختار؟
أميل إلى استخدام العقار D لأنه يحتوي على حجم تأثير
كبير ، وقيمة p صغيرة ، وقد انخفض تقدير تأثير تجربة النسخ داخل فاصل ثقة
95٪. بالتأكيد لن أذهب مع A لأنه يوفر فوائد هامشية ،
حتى لو وجدت التجربة تأثيرًا مهمًا من الناحية الإحصائية وتم تكرارها. لذا فإن التعريف القائم على
القيمة p للتكرار لا قيمة له عمليًا من وجهة نظر عملية.
يبدو أنه قبل مواصلة النقاش حول التكرار ، وبالتأكيد قبل
الإعلان عن أننا في أزمة استنساخ ، نحتاج إلى تعريف دقيق إحصائيًا وذو مغزى
علميًا للتكرار. لا يحتاج هذا التعريف بالضرورة إلى أن يكون ثنائي التفرع
(مكرر أم لا) وسيتطلب على الأرجح أكثر من تجربة تكرار واحدة وأكثر من إحصائية
موجزة واحدة: واحدة لحجم التأثير وواحدة لعدم اليقين. في غضون ذلك ، يجب أن نكون حريصين على عدم رفض العملية
العلمية الحالية ، والتي يبدو أنها تعمل بشكل جيد إلى حد ما إما في تجاهل أو فضح
النتائج الإيجابية الخاطئة أثناء إنتاج المعرفة والاكتشافات المفيدة.
حاشية سفلية حول القابلية
للتكرار مقابل النسخ المتماثل: كما أشار جيف ، فإن ورقة تعاون العلوم المفتوحة
التي تم الاستشهاد بها تتعلق بالنسخ ، وليس التكرار. تعتبر الدراسة قابلة للتكرار
إذا تمكن باحث مستقل من إعادة إنشاء الجداول والأشكال من البيانات الأولية الأصلية. ليس من السهل تعريف النسخ
المتماثل لأنه ينطوي على احتمالية. لتكرار التجربة ، يجب إجراؤها مرة أخرى ،
باستخدام عينة عشوائية مختلفة ومجموعة جديدة من أخطاء القياس.
لطلب تحليل
احصائي التواصل عبر الواتسب اضغط
هنا
ليست هناك تعليقات:
إرسال تعليق