Нормальний розподіл

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Нормальний розподіл (розподіл Ґауса) — розподіл ймовірностей випадкової величини, що характеризується густиною ймовірності

Нормальний розподіл
Функція ймовірностей
Щільність (густина) нормального розподілу
Червона крива відповідає стандартному нормальному розподілу
Функція розподілу ймовірностей
Функція розподілу нормально розподіленої випадкової величини
Параметри μR — математичне сподівання
σ2 > 0 — дисперсія
Носій функції xR
Розподіл ймовірностей
Функція розподілу ймовірностей (cdf)
Середнє μ
Медіана μ
Мода μ
Дисперсія
Коефіцієнт асиметрії 0
Коефіцієнт ексцесу 0
Ентропія
Твірна функція моментів (mgf)
Характеристична функція

де  — математичне сподівання,  — дисперсія випадкової величини. Параметр також відомий, як стандартне відхилення. Розподіл із μ = 0 та σ 2 = 1 називають стандартним нормальним розподілом.

Центральна гранична теорема стверджує, що нормальний розподіл виникає тоді, коли дана випадкова величина являє собою суму великого числа незалежних випадкових величин, кожна з яких відіграє незначну роль в утворенні всієї суми. Наприклад, відстань від влучення снаряду гармати до цілі при великій кількості пострілів характеризується саме нормальним розподілом.

Нормально розподілена випадкова величина позначається так: .

Визначення[ред. | ред. код]

Стандартний нормальний розподіл[ред. | ред. код]

Найпростіший варіант нормального розподілу відомий як стандартний нормальний розподіл. Це особливий випадок, коли і , і його описують такою функцією густини імовірності:

Коефіцієнт в даному виразі гарантує, що загальна площа під кривою дорівнює одиниці.[1] Множник в показнику експоненти гарантує, що розподіл має одиничну дисперсію (тобто дисперсія дорівнює одиниці), а таким чином і одиничне стандартне відхилення. Ця функція симетрична довкола значення , де вона набуває свого максимального значення і має дві точки перегину при і .

В деяких авторів можуть бути відмінності щодо того який нормальний розподіл вважати "стандартним". Гаусс визначив стандартний нормальний розподіл як такий, що має дисперсію , і має функцію густини імовірності:

Стілгер[en][2] пішов навіть далі, коли визначив стандартний нормальний розподіл із дисперсією так:

Загальний нормальний розподіл[ред. | ред. код]

Кожний нормальний розподіл є різновидом стандартного нормального розподілу, область значень якого була розтягнута на величину (стандартне відхилення) і потім переміщена на (середнє значення):

Густина імовірності повинна масштабуватися на так щоб інтеграл зберігав значення 1.

Нехай це стандартне нормальний параметр відхилення[en], тоді матиме нормальний розподіл із сподіванням і стандартним відхиленням . І навпаки, якщо є нормальним відхиленням із параметрами і , тоді матиме стандартний нормальний розподіл. Цей варіант називається стандартизованою формою

Кожен нормальний розподіл є експонентою квадратичної функції:

де і . В даній формі, середнє значення дорівнює , а дисперсія дорівнює . У випадку стандартного нормального розподілу, , , а .

Позначення[ред. | ред. код]

Густина імовірності стандартного Гауссового розподілу (стандартного нормального розподілу) (із нульовим середнім і одиничною дисперсією) часто позначається грецькою літерою (Фі).[3] Також часто використовується інша форма літери фі — .

Нормальний розподіл позначають як або .[4] Таким чином, якщо випадкова величина має нормальний розподіл із середнім і дисперсією , це можна записати наступним чином

Альтернативні параметризації[ред. | ред. код]

Деякі автори виступають за використання параметру як такий, що визначає ширину розподілу, замість відхилення або дисперсії . Цей параметр як правило визначається як обернена дисперсія, .[5] Формула розподілу тоді приймає наступний вигляд:

Цей варіант, як стверджують, має переваги при виконанні чисельних розрахунків коли має значення дуже близьке до нуля і в деяких контекстах спрощує формули, наприклад, у Баєсовій статистиці випадкових величин із багатовимірним нормальним розподілом.

Також коефіцієнт може визначатися як обернене відхилення , тоді вираз нормального розподілу стане наступним:

На думку Стінглера, таке формулювання має переваги у швидкому запам'ятовуванні формули, і дозволяє мати просте наближення формул для квантилів розподілу.

Твердження[ред. | ред. код]

Якщо генеральна сукупність вимірів нормально розподілена, характеризується ступенем квантування вимірів не має систематичних похибок, тоді:

  • З урахуванням ступеня квантування середнє значення визначається з імовірністю[8]

Особливість[ред. | ред. код]

Якщо дискретні випадкові величини мають нормальний розподіл імовірностей, то їх сума   різниця також будуть нормально розподілені, а добуток величин не буде підпорядкований нормальному розподілу. [9]

Властивості[ред. | ред. код]

Нормальний розподіл із функцією густини (математичним сподіванням і стандартним відхиленням ) має наступні властивості:

  • Він симетричний відносно точки яка одночасно є модою, медіаною і середнім значенням розподілу.[10]
  • Розподіл є одномодальним: його перша похідна додатна при від'ємна при і дорівнює нулю лише в точці
  • Площа, що обмежена під кривою і віссю дорівнює одиниці.
  • Її функція густини має дві точки перегину (де друга похідна функції дорівнює нулю і змінює знак), що віднесені від середнього на величину одного стандартного відхилення, тобто на і [10]
  • Густина є логарифмічно угнутою функцією.[10]
  • Функція густини є нескінченно диференційованою, і супергладкою[en] порядку 2.[11]

Крім того, густина стандартного нормального відхилення (тобто, з і ) має також наступні властивості:

  • Її перша похідна дорівнює
  • Її друга похідна дорівнює
  • В загальному випадку, її n-та похідна дорівнює де є n-им (імовірнісний) поліномом Ерміта.[12]
  • Ймовірність того, що нормально розподілена випадкова величина із відомими і знаходиться в певному проміжку, можна розрахувати із відомого факту, що частка має стандартний нормальний розподіл.

Лог-нормальний розподіл[ред. | ред. код]

Функція розподілу F(y), в якій логарифм величини є нормально розподіленим:

F(y) = fgauss(lny),

де fgauss (x) — функція розподілу Гауса.

Такою функцією описується розподіл частинок аерозолю за розмірами.[13]

Кумулятивна функція розподілу ймовірностей[ред. | ред. код]

Кумулятивна функція розподілу ймовірностей стандартного нормального розподілу, зазвичай позначають великою грецькою літерою (фі), є наступним інтегралом

В статистиці часто застосовують споріднену функції помилок, або , що визначена як імовірність випадкової величини із нормальним розподілом, що має нульове середнє і дисперсію 1/2 потрапити у проміжок значень ; що записується наступним чином

Ці інтеграли не можливо виразити за допомогою елементарних функцій, що часто називають спеціальними функціями. Однак існує багато відомих чисельних апроксимацій; див. below.

Ці дві функції тісно пов'язані одна з одною, а саме:

Для випадку загального нормального розподілу із густиною , середнім і відхиленням , кумулятивна функція розподілу буде наступною

Компоненту кумулятивної функції стандартного нормального розподілу, , часто називають Q-функцією[en], особливо в технічній сфері.[14][15] Вона задає ймовірність того що значення стандартної нормальної випадкової величини буде перевищувати значення : . Також іноді можуть використовуватися інші визначення -функції, усі пов'язані із простими перетвореннями .[16]

Графік кумулятивної функції стандартного нормального розподілу має 2-кратну обертову симетрію[en] довкола точки (0,1/2); що задається як, . її первісна (невизначений інтеграл) дорівнює

Кумулятивна функція розподілу ймовірностей стандартного нормального розподілу може розкладатися в ряд за допомогою інтегрування частинами:

де позначає Подвійний факторіал.

Центральна гранична теорема[ред. | ред. код]

Із збільшенням кількості дискретних подій, функція починає нагадувати нормальний розподіл
Порівняння функцій густини імовірності, для суми із підкидувань 6-гранної гральної кістки, що показує їхню збіжність до нормального розподілу із збільшенням , що відповідає центральній граничній теоремі. На графіку праворуч-внизу, показані масштабовані, накладені один на одного згладжені межі попередніх графіків і їх порівняння із нормальним розподілом (чорна крива).

Центральна гранична теорема стверджує, що при певних умовах, сума багатьох випадкових величин буде мати розподіл близький до нормального розподілу. Зокрема, якщо  — незалежні і однаково розподілені випадкові величини із однаковим розподілом, нульовим середнім, і дисперсією і з є їхнім середнім масштабованим на

Тоді, із збільшенням , розподіл імовірностей величини буде збігатися із нормальним розподілом із нульовим середнім і дисперсією .

Теорему можна поширити і для випадку коли величини не є незалежними і/або не є однаково розподіленими, але тоді є умови на степені залежності і моменти розподілів.

Багато статистичних критеріїв, функцій внеску, і статистичних оцінок, що застосовуються на практиці містять в своїй основі суми певних випадкових величин, і навіть ще більшу кількість статистичних оцінок можна представити як суму випадкових величин використовуючи функції впливу. Центральна гранична теорема стверджує, що такі статистичні параметри будуть мати асимптотично нормальні розподіли.

Центральна гранична теорема також передбачає, що певні розподіли можливо апроксимувати за допомогою нормального розподілу, наприклад:

  • Біноміальний розподіл є наближено нормальним із середнім і дисперсією при великих і при , що не є досить близьке до 0 або 1.
  • Розподіл Пуассона із параметром є наближено нормальним із середнім і дисперсією , при великих значеннях .[17]
  • Розподіл хі-квадрат є наближено нормальним із середнім і дисперсією , для великих .
  • t-розподіл Стьюдента є наближено нормальним із середнім 0 і дисперсією 1 при великих .

Наскільки достатньою є точність таких апроксимацій залежить від задачі, в якій вони застосовуються і швидкості збіжності до нормального розподілу. Як правило, такі апроксимації є менш точними на кінцях розподілу.

Загальна верхня межа похибки апроксимації для центральної граничної теореми задається теоремою Беррі — Ессена[en], поліпшення апроксимації досягається за допомогою рядів Еджворта[en].

Джерела інформації[ред. | ред. код]

  1. За доведенням цього див. Гауссів інтеграл[en]
  2. Stigler, (1982)
  3. Halperin, Hartley та Hoel, (1965, item 7)
  4. McPherson, (1990, с. 110)
  5. Bernardo та Smith, (2000, с. 121)
  6. Пряха Б. Г., Білецький Я. В. Про точність геодезичних вимірювань // Вісник геодезії та картографії. — 2003. — № 3(30). — С. 43-49.
  7. Пряха Б. Г. Про точність вимірювань // Реконструкція житла: Науково-виробничне видання. — Вип. 7. — К.: «Поліграф-експрес», 2006. — С. 122–123.
  8. Пряха Б. Оцінювання середніх значень // Сучасні досягнення геодезичної науки та виробництва, 2007, випуск I(13): Зб. наук. пр. — Л.: Видавництво Національного університету «Львівська політехніка». — С. 140–145.
  9. Пряха Б. Означення суми, різниці та добутку випадкових величин // Геодезія, картографія і аерофотознімання: Міжвідомчий науково-технічний збірник. — Л. : Видавництво Національного університету «Львівська політехніка». — 2009. — Вип. 72. — С. 41—49.
  10. а б в Patel та Read, (1996, [2.1.4])
  11. Fan, (1991, с. 1258)
  12. Patel та Read, (1996, [2.1.8])
  13. Глосарій термінів з хімії // Й. Опейда, О. Швайка. Ін-т фізико-органічної хімії та вуглехімії ім. Л. М. Литвиненка НАН України, Донецький національний університет. — Донецьк : Вебер, 2008. — 758 с. — ISBN 978-966-335-206-0
  14. Scott, Clayton; Nowak, Robert (August 7, 2003). The Q-function. Connexions. 
  15. Barak, Ohad (April 6, 2006). Q Function and Error Function. Tel Aviv University. Архів оригіналу за March 25, 2009.  Проігноровано невідомий параметр |df= (довідка)
  16. Weisstein, Eric W. Normal Distribution Function(англ.) на сайті Wolfram MathWorld.
  17. Normal Approximation to Poisson Distribution. Stat.ucla.edu. Процитовано 2017-03-03. 

Див. також[ред. | ред. код]