الانحدار اللوجستي
هو تحليل الانحدار الخطي الذي يتم إجراؤه عندما يكون المتغير التابع ثنائي التفرع
(ثنائي). مثل كل الانحدارات الخطية ، فإن الانحدار اللوجستي هو تحليل تنبؤي. يستخدم
الانحدار اللوجستي لوصف البيانات وشرح العلاقة بين متغير ثنائي تابع واحد ومتغير أو
أكثر من المتغيرات المستقلة ذات المستوى المستمر (الفاصل الزمني أو مقياس النسبة).
تطلب الانحدار الخطي القياسي أن
يكون المتغير التابع ذا مقياس مستوى مستمر (فاصل زمني أو نسبة). كيف يمكننا تطبيق نفس المبدأ على
متغير ثنائي التفرع (0/1)؟ يفترض الانحدار اللوجستي أن المتغير التابع هو حدث عشوائي. على سبيل المثال ، إذا قمنا
بتحليل معدل قتل مبيدات الآفات ، فإن الحدث الناتج إما أن يكون على قيد الحياة أو الموت . نظرًا لأن أكثر الأخطاء مقاومة
يمكن أن تكون فقط من هاتين الحالتين ، فإن الانحدار اللوجستي يفكر في احتمالية قتل
الخطأ. إذا كان احتمال قتل الحشرة أكبر من 0.5 ، فمن المفترض أنه ميت ، وإذا
كان أقل من 0.5 يفترض أنه على قيد الحياة.
من الشائع جدًا إجراء تحليل
انحدار خطي منتظم باستخدام متغيرات وهمية مستقلة. المتغير الوهمي هو متغير ثنائي
يتم التعامل معه كما لو كان مستمرًا. من الناحية العملية ، يزيد المتغير الوهمي من التقاطع وبالتالي إنشاء
خط مواز ثانٍ أعلى أو أسفل خط الانحدار المقدر.
بدلاً من ذلك ، يمكننا محاولة
إنشاء انحدار خطي متعدد باستخدام متغير تابع وهمي. هذا النهج ، ومع ذلك ، لديه
اثنين من أوجه القصور الرئيسية. أولاً ، يمكن أن يؤدي إلى احتمالات خارج الفاصل الزمني (0،1) ،
وثانيًا ، سيكون لكل القيم المتبقية نفس التباين (فكر في الخطوط المتوازية في مخطط zpred * zresid).
لحل هذه العيوب يمكننا استخدام
دالة لوجستية لتقييد قيم الاحتمال بـ (0،1). الوظيفة اللوجستية هي p (x) = 1/1 + exp (-x). من الناحية الفنية ، يمكن حل هذا إلى ln (p / (1-p)) = a + b
* x. ln (p / (1-p)) تسمى أيضًا احتمالات السجل. في بعض الأحيان بدلاً من نموذج
لوجيستي للانحدار اللوجستي ، يتم استخدام نموذج احتمالي. يوضح الرسم البياني التالي الفرق
بين اللوغاريتم والنموذج الاحتمالي لقيم مختلفة [-4،4]. يشيع استخدام كلا النموذجين في
الانحدار اللوجستي ؛ في معظم الحالات ، يكون النموذج مزودًا بكلتا الوظيفتين ويتم اختيار
الوظيفة ذات الملاءمة الأفضل. ومع ذلك ، فإن probit يفترض التوزيع الطبيعي لاحتمال الحدث ، عندما يفترض logit توزيع السجل. وبالتالي فإن الفرق بين
اللوغاريتم والاختبار عادة ما يكون مرئيًا فقط في عينات صغيرة.
في مركز تحليل الانحدار اللوجستي
تكمن مهمة تقدير احتمالات سجل الحدث. رياضيا ، يقدر الانحدار اللوجستي وظيفة الانحدار الخطي المتعددة
المحددة على أنها
الانحدار اللوجستي مشابه للتحليل
التمييزي. يستخدم التحليل التمييزي خط الانحدار لتقسيم العينة إلى مجموعتين على
طول مستويات المتغير التابع. في حين أن تحليل الانحدار اللوجستي يستخدم مفهوم الاحتمالات وتسجيل
الاحتمالات مع احتمال القطع 0.5 ، فإن التحليل المميز يقطع المستوى الهندسي الذي
تمثله السحابة المبعثرة. يكمن الاختلاف العملي في افتراضات كلا الاختبارين. إذا كانت البيانات طبيعية متعددة
المتغيرات ، فإن المثلية الجنسية موجودة في التباين والتغاير والمتغيرات المستقلة
مرتبطة خطيًا. ثم يتم استخدام التحليل التمييزي لأنه أكثر قوة وكفاءة من الناحية
الإحصائية. عادةً ما يكون التحليل التمييزي أكثر دقة من الانحدار اللوجستي من
حيث التصنيف التنبئي للمتغير التابع.
الانحدار اللوجستي في برنامج SPSS
من حيث الانحدار اللوجستي ،
دعونا ننظر في المثال التالي:
تم إجراء دراسة بحثية على 107
تلميذ. تم قياس هؤلاء التلاميذ بخمسة اختبارات كفاءة مختلفة - اختبار لكل
فئة مهمة (قراءة ، كتابة ، فهم ، تلخيص ، إلخ). كيف تتنبأ اختبارات الكفاءة هذه
بما إذا كان التلاميذ يجتازون امتحان نهاية العام؟
نحتاج أولاً إلى التحقق من أن
جميع الخلايا في نموذجنا مأهولة. نظرًا لعدم وجود أي متغيرات فئوية في تصميمنا ، فسوف نتخطى هذه
الخطوة.
تم العثور على الانحدار اللوجستي
في برنامج SPSS ضمن التحليل / الانحدار / اللوجستي الثنائي ...
هذا يفتح مربع الحوار لتحديد
النموذج. نحن هنا بحاجة إلى إدخال المتغير الاسمي امتحان (تمر = 1، تفشل = 0) في المربع
المتغير التابع ونحن ندخل كل اختبارات الكفاءة باعتبارها اللبنة الأولى من
المتغيرات المشاركة في النموذج.
تتيح القائمة Categorical… تحديد تباينات للمتغيرات الفئوية (التي لا تتوفر لدينا في نموذج
الانحدار اللوجستي الخاص بنا) ، وتقدم Options… العديد من الإحصائيات الإضافية
التي لا تحتاج إليها.
ليست هناك تعليقات:
إرسال تعليق