چند همخطی Multicollinearity
| Term | شرح |
|---|---|
| چند همخطی Multicollinearity | چندهمخطی (Multicollinearity) زمانی رخ میدهد که دو یا چند متغیر مستقل در یک مدل رگرسیون بهشدت با یکدیگر همبستگی بالا داشته باشند.
تعریف Multicollinearity (چندهمخطی)وقتی متغیرها بسیار مشابه باشند، مدل نمیتواند اثر هر متغیر را بهطور جداگانه تشخیص دهد و این موضوع باعث:
میشود. چرا Multicollinearity مشکلساز است؟1. غیرقابلاعتماد شدن ضرایب رگرسیونضرایب (Betas) ممکن است مقدارهای غیرمنطقی یا با علامت اشتباه پیدا کنند. 2. افزایش خطا (Standard Error)این باعث میشود متغیرها غیرمعنیدار به نظر برسند، درحالیکه در واقعیت اثرگذار هستند. 3. کاهش توان تحلیلمدل نمیتواند بفهمد کدام متغیر واقعاً عامل تغییرات است، چون متغیرها تقریباً همان اطلاعات را تکرار میکنند. چگونه Multicollinearity را تشخیص دهیم؟1. استفاده از VIF (Variance Inflation Factor)یکی از بهترین ابزارهای تشخیصی.
اگر یک متغیر VIF بسیار بالا داشته باشد، یعنی بهشدت با سایر متغیرها همبسته است. 2. ماتریس همبستگی (Correlation Matrix)اگر همبستگی بین دو متغیر بیشتر از 0.8 یا 0.9 باشد، احتمال وجود Multicollinearity زیاد است. راهکارهای رفع Multicollinearity1. حذف متغیرهای تکراری یا مشابهاگر دو متغیر تقریباً یک مفهوم را نشان دهند، یکی را حذف کنید. 2. تبدیل متغیرهااستفاده از:
میتواند همخطی را کاهش دهد. 3. استفاده از رگرسیون Ridge یا Lassoاین مدلهای Regularized بهطور طبیعی Multicollinearity را کنترل میکنند. Multicollinearity در تحلیل سرمایهگذاریدر تحلیل مالی استفاده از شاخصهایی که بهطور طبیعی همبستگی زیادی دارند (مثلاً چند شاخص تکنیکال مشابه) باعث ایجاد تحلیل اشتباه میشود. مثال: بنابراین تحلیلگران باید از شاخصهای متنوع استفاده کنند تا دید دقیقتری نسبت به بازار داشته باشند.
نکات کلیدی درباره Multicollinearity
کلیک ها - 28
Synonyms:
چند همخطی,Multicollinearity |
