Узагальнена дисперсія

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У багатовимірній статистиці узага́льнена диспе́рсія (англ. generalized variance), на додачу до загальної дисперсії[de], є одним з ключових показників загального розсіювання багатовимірного набору даних (з змінними ). При порівнянні узагальнених дисперсій двох різних загальних сукупностей можливо, що одна сукупність має більшу узагальнену дисперсію, ніж інша, але все ж меншу загальну дисперсію.

Узагальнену дисперсію визначають через визначник коваріаційної матриці. Поняття узагальненої дисперсії запровадив Семюел Стенлі Уілкс[en].

Визначення

[ред. | ред. код]

Для коваріаційної матриці загальної сукупності узагальнену дисперсію визначають як її визначник, тобто,[1]

.

І навпаки, ви́біркову узагальнену дисперсію визначають як . В цьому випадку подає ви́́біркову коваріаційну матрицю[de].

Геометрична інтерпретація

[ред. | ред. код]

Ви́біркова узагальнена дисперсія має геометричну інтерпретацію. Розширення еліпса на понад два виміри називають гіпереліпсоїдом. p-вимірний гіпереліпсоїд з центром в та на основі для стандартизації відстані до центру містить підмножину спостережень вибірки. Еліпсоїд має осі, пропорційні квадратним кореням з власних значень ви́біркової коваріаційної матриці. Можливо показати, що об'єм цього еліпсоїда пропорційний .[1]

Примітки

[ред. | ред. код]
  1. а б Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 73. (англ.)