Багатовимірний нормальний розподіл

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Багатовимірний нормальний розподіл

MultivariateNormal.png
Множина точок, що представляють елементарні події багатовимірного нормального розподілу із і , разом з якими показано еліпс розміром в 3-сігми, два маргінальні розподіли і дві 1-вимірні гістограми.
Функція розподілу ймовірностей
Параметри μRkкоефіцієнт зсуву
ΣRk×kковаріаційна матриця (додатноозначена матриця)
Носій функції xμ + span(Σ) ⊆ Rk
Розподіл ймовірностей
існує лише за умови, що Σ є додатньоозначена матриця
Функція розподілу ймовірностей (cdf) (не має аналітичного виразу)
Середнє μ
Медіана
Мода μ
Дисперсія Σ
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія
Твірна функція моментів (mgf)
Характеристична функція

Багатовимірний нормальний розподіл (чи багатовимірний гаусів розподіл) у теорії ймовірностей — це узагальнення одновимірного нормального розподілу для випадку із багатьма вимірами. Відповідно до одного із визначень стверджують, що вектор випадкових величин має k-варіативний нормальний розподіл якщо кожна лінійна комбінація його k компонент має одновимірний нормальний розподіл. В основному його важливість випливає із узагальнення центральної граничної теореми для багатьох вимірів. Багатовимірний нормальний розподіл часто використовують аби описати, принаймні наближено, будь яку множину (можливо) корельованих випадкових величин із дійсними значенням, кожна з яких скупчується довкола середнього значення.

Позначення і параметризація[ред. | ред. код]

Багатовимірний нормальний розподіл k-вимірного вектору випадкових величин X = [X1, X2, …, Xk]T може записуватися у формі наступної нотації:

або із метою явно зазначити, що X є k-вимірним:

із k-вимірним вектором середніх значень

і матрицею коваріацій

Визначення[ред. | ред. код]

Випадковий вектор має багатомірний нормальний розподіл, якщо виконується одне з наступних еквівалентних умов:

  • Довільна лінійна комбінація компонентів вектора має нормальний розподіл є константою.
  • Існує вектор незалежних стандартних нормальних випадкових величин , дійсний вектор і матриця розмірності , такі що:
.
.

Зауваження[ред. | ред. код]

  • Якщо розглядати тільки розподілу з невиродженою коваріаційною матрицею, то еквівалентним буде також наступне визначення:
Існує вектор і додатно визначена симетрична матриця розмірності , такі що щільність ймовірності вектора має вид:
,
де визначник матриці , а — матриця зворотна до


  • Вектор є вектором середніх значень , а — його коваріаційна матриця
  • У випадку , багатовимірний нормальний розподіл зводиться до звичайного нормального розподілу.
  • Якщо випадковий вектор має багатовимірний нормальний розподіл, то пишуть .

Властивості[ред. | ред. код]

  • Якщо вектор має багатовимірний нормальний розподіл, то його компоненти мають одновимірний нормальний розподіл. Зворотне, узагалі говорячи, невірно (див. приклад [1])!
  • Якщо випадкові величини мають одномірний нормальний розподіл і спільно незалежні, те випадковий вектор має багатомірний нормальний розподіл. Матриця коваріацій такого вектора діагональна.
  • Якщо має багатомірний нормальний розподіл, і його компоненти попарно некорельовані, то вони незалежні. Однак, якщо тільки компоненти мають одномірний нормальний розподіл і попарно не корелюють, те звідси не випливає, що вони незалежні.
Контрприклад. Нехай , а з рівними ймовірностями. Тоді якщо , те кореляція і дорівнює нулю. Однак, ці випадкові величини залежні.
  • Багатомірний нормальний розподіл стійко щодо лінійних перетворень. Якщо , а — довільна матриця розмірності , то
.

Функція густини[ред. | ред. код]

Спільна функція густини біваріативного нормального розподілу

Не вироджений випадок[ред. | ред. код]

Багатовимірний нормальний розподіл називають "не виродженим" коли його симетрична матриця коваріацій є додатньоозначеною. В такому випадку розподіл має функцію густини:[1]

де це k-вимірний вектор стовпець дійсних чисел і це детермінант для . Вищенаведене рівняння спрощується до аналогічного рівняння, що відповідає одновимірному нормальному розподілу якщо є матрицею розміром (тобто єдиним дійсним числом).

Циркулярно-симетрична версія комплексного нормального розподілу має дещо відмінну форму.

Кожен окіл ізо-густини—окіл точок в k-вимірному просторі, в кожній з яких буде деяке стале значення густини —є еліпсом або його узагальненням для більших вимірів; оскільки багатовимірний нормальний розподіл є особливим випадком еліптичних розподілів[en].

В описовій статистиці відомо як відстань Махаланобіса, яка задає відстань обраної точки від середнього . Зауважте, що у випадку коли , розподіл зводиться до одновимірного нормального розподілу, і відстань Махаланобіса зводиться до абсолютного значення стандартної оцінки[en].

Біваріативний випадок[ред. | ред. код]

У 2-вимірному несингулярному випадку (k = rank(Σ) = 2), функція густини імовірності для вектору [X Y]′ є наступною:

де ρ — кореляція між X і Y і де і . В такому випадку,

У біваріативному випадку, перша еквівалентна умова встановлення нормальності багатовимірного розподілу може бути менш сувора: для того, щоб зробити висновок чи є вектор [X Y]′ біваріативно нормальним достатньо перевірити чи зліченно велика кількість відмінних лінійних комбінацій X і Y є нормально розподілені.[2]

Біваріативні околи ізо-густини на площині x,y є еліпсами. Із збільшенням абсолютного значення коефіцієнту кореляції ρ, ці околи будуть сплющуватися до наступної прямої :

Це пояснюється тим, що якщо в даному виразі sgn(ρ) замінити на ρ, воно є найкращим лінійним незміщеним передбаченням[en] для Y, що задане значенням X.[3]

Багатомірна центральна гранична теорема[ред. | ред. код]

Нехай  — послідовність незалежних і однаково розподілених випадкових векторів, кожний з який має середнє і невироджену матрицю коваріацій . Позначимо через вектор часткових сум. Тоді при має місце збіжність розподілів векторів , де має розподіл . В умовах багатовимірної центральної граничної теореми розподіл будь-яких неперервних функцій збігається до розподілу . Як нам буде потрібна тільки .

Наслідок[ред. | ред. код]

В умовах багатовимірної центральної граничної теореми має місце збіжність .

Примітки[ред. | ред. код]

  1. UIUC, Lecture 21. The Multivariate Normal Distribution, 21.5:"Finding the Density".
  2. Hamedani, G. G.; Tata, M. N. (1975). On the determination of the bivariate normal distribution from distributions of linear combinations of the variables. The American Mathematical Monthly 82 (9): 913–915. doi:10.2307/2318494. 
  3. Wyatt, John. Linear least mean-squared error estimation. Lecture notes course on applied probability. Процитовано 23 January 2012.