Skip to main content

چند همخطی Multicollinearity

نام "واژه" را وارد کنید.
Term شرح
چند همخطی Multicollinearity
چندهمخطی (Multicollinearity) زمانی رخ می‌دهد که دو یا چند متغیر مستقل در یک مدل رگرسیون به‌شدت با یکدیگر همبستگی بالا داشته باشند.

تعریف Multicollinearity (چندهمخطی)

وقتی متغیرها بسیار مشابه باشند، مدل نمی‌تواند اثر هر متغیر را به‌طور جداگانه تشخیص دهد و این موضوع باعث:

  • کاهش اعتبار تحلیل
  • افزایش خطای آماری
  • تخمین‌های نامطمئن و ناپایدار

می‌شود.


چرا Multicollinearity مشکل‌ساز است؟

1. غیرقابل‌اعتماد شدن ضرایب رگرسیون

ضرایب (Betas) ممکن است مقدارهای غیرمنطقی یا با علامت اشتباه پیدا کنند.

2. افزایش خطا (Standard Error)

این باعث می‌شود متغیرها غیرمعنی‌دار به نظر برسند، درحالی‌که در واقعیت اثرگذار هستند.

3. کاهش توان تحلیل

مدل نمی‌تواند بفهمد کدام متغیر واقعاً عامل تغییرات است، چون متغیرها تقریباً همان اطلاعات را تکرار می‌کنند.


چگونه Multicollinearity را تشخیص دهیم؟

1. استفاده از VIF (Variance Inflation Factor)

یکی از بهترین ابزارهای تشخیصی.

  • VIF = 1 → بدون همخطی
  • VIF بین 1 تا 5 → قابل‌قبول
  • VIF بالای 5 → هشدار
  • VIF بالای 10 → مشکل جدی

اگر یک متغیر VIF بسیار بالا داشته باشد، یعنی به‌شدت با سایر متغیرها همبسته است.


2. ماتریس همبستگی (Correlation Matrix)

اگر همبستگی بین دو متغیر بیشتر از 0.8 یا 0.9 باشد، احتمال وجود Multicollinearity زیاد است.


راهکارهای رفع Multicollinearity

1. حذف متغیرهای تکراری یا مشابه

اگر دو متغیر تقریباً یک مفهوم را نشان دهند، یکی را حذف کنید.

2. تبدیل متغیرها

استفاده از:

  • تفاضل‌ها
  • لگاریتم
  • استانداردسازی

می‌تواند همخطی را کاهش دهد.

3. استفاده از رگرسیون Ridge یا Lasso

این مدل‌های Regularized به‌طور طبیعی Multicollinearity را کنترل می‌کنند.


Multicollinearity در تحلیل سرمایه‌گذاری

در تحلیل مالی استفاده از شاخص‌هایی که به‌طور طبیعی همبستگی زیادی دارند (مثلاً چند شاخص تکنیکال مشابه) باعث ایجاد تحلیل اشتباه می‌شود.

مثال:
اگر تحلیل‌گر RSI، Stochastic و Williams %R را همزمان وارد مدل کند، بسیاری از آن‌ها تقریباً یک سیگنال مشابه را تکرار می‌کنند و Multicollinearity ایجاد می‌شود.

بنابراین تحلیل‌گران باید از شاخص‌های متنوع استفاده کنند تا دید دقیق‌تری نسبت به بازار داشته باشند.

 نمودار همبستگی


نکات کلیدی درباره Multicollinearity

  • زمانی رخ می‌دهد که متغیرهای مستقل یک مدل همبستگی بسیار بالا داشته باشند.
  • باعث کاهش اعتبار تحلیل و ضرایب غیرقابل‌اعتماد می‌شود.
  • VIF بالای 5 نشانه وجود مشکل است.
  • می‌توان با حذف متغیرها، تبدیل داده‌ها یا رگرسیون Ridge/Lasso مشکل را حل کرد.
  • در تحلیل سرمایه‌گذاری، استفاده از شاخص‌های متنوع ضروری است.
کلیک ها - 29
Synonyms: چند همخطی,Multicollinearity