Важіль (статистика)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У статистиці та, зокрема, у регресійному аналізі важіль — це міра віддаленості значень незалежної змінної спостереження від значень інших спостережень.

Точки із великими значеннями важелів — крайні спостереження або викиди незалежної змінної, тобто такі точки, що нестача сусідніх спостережень спричинить проходження побудованої регресійної моделі дуже близько до даної точки[1].

Сучасні пакети для статистичного аналізу включають до своїх властивостей різні кількісні міри виявлення впливових спостережень при проведенні регресійного аналізу; серед цих мір є частинний важіль, кількісна характеристика внеску змінної до важелів даних.

Лінійна регресійна модель[ред. | ред. код]

Означення[ред. | ред. код]

У лінійній регресійній моделі, оцінка важеля i-го спостереження визначається як:

де i-й діагональний елемент проекційної матриці ,

де  — матриця регресорів із одиничним стовпчиком на початку.

Якщо в матриці тільки 2 стовпці, то:

Оцінка важеля також відома як самочутливість спостереження або самовпливовість[2], як видно з

де та  — прогноз відгуку та відгук спостереження відповідно.

Межі важеля[ред. | ред. код]

Доведення[ред. | ред. код]

Відмітимо, що матриця H — ідемпотентна: , а також симетрична.

Тоді, прирівнюючи елементи ii матриці H до елементів ii матриці , отримаємо

та

Вплив на дисперсію залишків[ред. | ред. код]

Якщо використовувати звичайний метод найменших квадратів із фіксованою матрицею X, регресійними похибками , та

тоді  де  (i-й залишок регресії).

Іншими словами, якщо похибки моделі є гомоскедастичними, то оцінка важеля спостереження визначає ступінь шуму в помилковому передбаченні моделі.

Зауважимо, що  — ідемпотентна та симетрична матриця. Із цього випливає, що

Таким чином 

Залишок Стьюдента[ред. | ред. код]

Відповідні стьюдентизовані залишки — залишки, скореговані спостереженнями — особлива дисперсія залишків має наступний вигляд:

де  — відповідна оцінка дисперсії

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Еверітт, Б. С. (2002). Cambridge Dictionary of Statistics. Cambridge University Press. ISBN 0-521-81099-X. 
  2. Кардіналі, К. (червень 2013). Data Assimilation: Observation influence diagnostic of a data assimilation system. Архів оригіналу за 3 вересень 2014. Процитовано 25 грудень 2017.