Розподіл Пуассона

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Пуассона
Функція ймовірностей
Plot of the Poisson PMF
На горизонтальній осі відкладено значення параметру k. Функцію визначено лише для цілих k. Лінії між точками лише для зручності перегляду.
Функція розподілу ймовірностей
Plot of the Poisson CDF
На горизонтальній осі відкладено значення параметру k.
Параметри
Носій функції
Розподіл імовірностей
Функція розподілу ймовірностей (cdf) (де це неповна гамма функція та це ціла частина)
Середнє
Медіаназазвичай приблизно
Мода та якщо - ціле
Дисперсія
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія (для великих )
                   
Твірна функція моментів (mgf)
Характеристична функція

Пуассо́нівський розпо́діл — один з розподілів ймовірностей. Цей розподіл названо на честь французького вченого Сімеона Дені Пуассона. Випадкова величина X називається розподіленою за законом Пуассона (або, що те саме, має пуассонівський розподіл) з параметром λ, якщо для неї виконується рівність:

,

 

 

 

 

(1)

Популярне пояснення

[ред. | ред. код]

Пуассонівський розподіл справедливий для подій, які мають малу ймовірність чи трапляються нечасто. Ним, наприклад, можна описати ймовірність того, що футболіст заб'є гол у конкретному матчі. Іноді футболіст забиває один гол, рідше два, ще рідше робить хет-трик, Пеле одного разу забив вісім. Найчастіше футболіст не забиває жодного.

Ймовірність забити k голів за гру визначається параметром λ, що є середньою кількістю голів, які забиває футболіст. Якщо λ велике число, то ймовірність має досягати максимуму при якомусь k. В такому разі йдеться радше про баскетболіста, який може набирати, наприклад, 22 очка за гру в середньому. Тоді ймовірність набрати 2 очка буде малою. Ймовірність набрати 42 очка теж буде малою, а максимум ймовірності буде в районі саме 22 очок.

Історія

[ред. | ред. код]

Розподіл вперше було введено Пуассоном (1781-1840) і опубліковано разом із його теорією ймовірності, в 1837 році у своїй роботі Recherches sur la probabilité des jugements en matière criminelle et en matière civile ( «Дослідження ймовірності судових рішень в кримінальних і цивільних справах "). Робота теоретизувала кількість несправедливих засуджень в тій чи іншій країні, зосередивши увагу на деяких випадкових величинах N, що рахувало число дискретних явищ (іноді звані «події»), які мають місце на заданому інтервалі часу на інтервалі заданої довжини. Раніше результат дав Абрахам де Муавр (1711) в De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus у Філософських Працях Королівського Товариства. Це є прикладом закона Стіглера і це спонукало деяких авторів стверджувати, що розподіл Пуассона повинен носити ім'я де Муавра.

Практичне застосування цього розподілу було зроблено Ладіславом Борткевичем в 1898 році, коли йому було дано завдання дослідити число солдатів прусської армії,яких випадково забили коні ногами; цей експеримент ввів розподіл Пуассона в область надійності техніки.

Визначення

[ред. | ред. код]

Дискретна випадкова величина Х має розподіл Пуассона з параметром λ> 0, якщо при k = 0, 1, 2... функція ймовірності X визначається за формулою:

де:

Додатне дійсне число λ дорівнює математичному сподіванню X, а також її дисперсії

Розподіл Пуассона може бути застосований до систем з великим числом можливих подій, кожне з яких рідко зустрічається. Скільки таких подій відбуватиметься протягом фіксованого проміжку часу? При правильних обставинах, це випадкове число з розподілом Пуассона.

Традиційне визначення розподілу Пуассона містить два додатки, які можуть легко заповнюватися комп'ютером: ʎ^k і k!. Але їх ділення може також призвести до помилки округлення, яка дуже велика в порівнянні з е^-ʎ, і, отже, дати помилковий результат. Для стабільності функція ймовірності за Пуассоном повинна бути оцінена як

що математично еквівалентне, але є стабільнішим.

Властивості

[ред. | ред. код]

Середнє значення

[ред. | ред. код]

  • Всі напівваріанти розподілу Пуассона дорівнюють математичному сподіванню Х.
  • Математичне сподівання пуассонівського процесу іноді розкладається в добуток інтенсивності і експозиції (або в більш загальному плані виражається у вигляді інтеграла від "функції інтенсивності").

Медіана

[ред. | ред. код]

Оцінки для медіан (v) розподілу відомі і чіткі:

Вищі моменти

[ред. | ред. код]

Вищі моменти розподілу Пуассона є многочлени Тушара λ:

де {фігурні дужки} позначають числа Стірлінга другого роду. Коефіцієнти поліномів мають комбінаторний сенс. Насправді, коли математичне сподівання розподілу Пуассона дорівнює 1, то формула Добіньського каже, що n-ий момент дорівнює числу розбиття множини обсягом n.

Суми розподілених випадкових величин Пуассоном

[ред. | ред. код]

Якщо  є незалежними та , тоді . Є і протилежне твердження теореми Райкова, в якому говориться, що якщо випадкова величина з розподілом Пуассона розкладається в суму двох незалежних випадкових величин, то і кожна з цих двох незалежних випадкових величин має розподіл Пуассона.

Інші властивості

[ред. | ред. код]

  • Межі для хвостових ймовірностей випадкової величини Пуассона можуть бути отримані за допомогою аргументу нерівності Чернова.

Стрибки значень Пуассона

[ред. | ред. код]

Нехай та незалежні випадкові величини, з тоді ми маємо

Верхня межа доводиться за допомогою стандартної нерівності Чернова.

Нижню межу можна довести, зазначивши, що є ймовірністю того, що , де яка обмежена знизу де - це відстань Кульбака — Лейблера. Відзначаючи далі, що обчислення нижньої межі на безумовній ймовірності дає результат.

Доведення

[ред. | ред. код]

Дослідимо поведінку за умов теореми Пуассона. За формулою Тейлора при

звідки

 

 

 

 

(2)

Експонуванням (2), помноженого на , отримуємо нерівність

 

 

 

 

(3)

Дослідимо тепер поведінку множників правої частини формули Бернуллі. При

 

 

 

 

(4)

Оскільки

 

 

 

 

(5)

З нерівності (3) отримуємо

 

 

 

 

(6)

Оскільки то показники експонент в (6) прямують до А з неперервності експоненціальної функції маємо

 

 

 

 

(7)

Нарешті,

 

 

 

 

(8)

Перемноживши (4), (5), (7) і (8) i перейшовши до границі, отримаємо формулу Пуассона (1).

Двовимірний розподіл Пуассона

[ред. | ред. код]

Такий розподіл було поширено у двовимірному випадку. Функція для цього розподілу така:

при

Маргінальним розподілом є Пуассон(θ1) і Пуассон(θ2), а коефіцієнт кореляції обмежується діапазоном

Простий спосіб для генерації двовимірного розподілу Пуассона : взяти три незалежні розподіли Пуассона зі значеннями і потім встановити . Функція ймовірності двомірного розподілу Пуассона така:

Див. також

[ред. | ред. код]

Джерела

[ред. | ред. код]