Мультиколінеарність

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Під мультиколінеарністю розуміють наявність лінійної залежності між двома або більше факторними (незалежними) змінними у регресійній моделі.

Приклади мультиколінеарності[ред. | ред. код]

Якщо два предиктори (незалежні змінні) у моделі є однією змінною але у різних метричниї шкалах. Наприклад, ріст людини у сантиметрах і ріст людини у дюймах. Коефіцієнт кореляції між двома змінними буде рівен 1. Аби уникнути мультиколінеарності, у модель має вступувати лише одна із двох змінних.

Наслідки мультиколінеарності[ред. | ред. код]

  • зміщення оцінок параметрів моделі;
  • збільшення коваріації оцінок;
  • незначущість параметрів моделі (t-статистика менша за критичну).

Ознаки мультиколінеарності[ред. | ред. код]

  • велике значення коефіцієнту детермінації поряд з незначущістю коефіцієнтів моделі;
  • велике значення парних коефіцієнтів кореляції незалежних (факторних) змінних.

Методи виявлення мультиколінеарності[ред. | ред. код]

Алгоритм Фаррара-Глобера[ред. | ред. код]

  1. Складається матриця R попарних коефіцієнтів кореляції: , де  — кількість факторних змінних у моделі;
  2. Обчислюється визначник матриці R: ;
  3. Розраховується ;
  4. Якщо більше критичного (табличного) значення, то мультиколінеарність у моделі присутня.

VIF[ред. | ред. код]

Розрахунок дисперсійно-інфляційного VIF-фактору для кожного з коефіцієнтів моделі за формулою:

,

де : є коефіцієнт детермінації. Вважається, що коєфіцієнти, VIF-фактор яких більший за 10 є мультиколінеарними. [1]

Джерела[ред. | ред. код]