Користувач:Yura Kuch/Біноміальний розподіл Пуассона

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Біноміальний розподіл Пуассона
Параметри — ймовірності успіху для кожного з випробувань
Носій функції
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнє
Медіана {{{median}}}
Мода {{{mode}}}
Дисперсія
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія {{{entropy}}}
Твірна функція моментів (mgf)
Характеристична функція {{{char}}}

У теорії ймовірностей та статистиці біноміальний розподіл Пуассона є дискретним ймовірнісним розподілом суми незалежних випробувань Бернуллі, які не обов'язково мають однаковий розподіл. Концепція отримала назву на честь Сімеона Дені Пуассона.

Інакше кажучи, це ймовірнісний розподіл кількості успіхів у колекції з незалежних експериментів з можливими відповідями "так" або "ні" та імовірностями успіху . Звичайний біноміальний розподіл є спеціальним випадком біноміального розподілу Пуассона, коли всі ймовірності успіху однакові, тобто .

Визначення

[ред. | ред. код]

Функція ймовірностей

[ред. | ред. код]

Імовірність успішних випробувань із загальної кількості можна записати у вигляді суми [1]

,

де - це множина всіх підмножин з , вибрані з колекції . До прикладу розглянемо випадок, якщо = , тоді . є доповненням до , тобто .

Множина міститиме елементів. Цю суму не можливо обчислити на практиці, якщо кількість випробувань мала (наприклад, якщо = , містить понад елементів). Однак існують інші, більш ефективні способи обчислення .

Поки жодна з ймовірностей успіху дорівнюватиме одиниці, обчислити ймовірність успіхів можливо за рекурсивною формулою [2] [3]

,

де

Рекурсивна формула не є чисельно стійкою, тому, якщо кількість випробувань перевищувати їй треба шукати заміну. Альтернативою може стати використання алгоритму «розділяй і володарюй»: якщо ми припустимо, що є степенем двійки, тоді позначивши через біном Пуассона , а оператор згортки через , маємо наступне: .

Іншою можливістю є використання дискретного перетворення Фур'є . [4]

,

де і .

Існують й інші методи обчислення ймовірностей описані в «Статистичних застосуваннях біноміального Пуассона та умовного розподілу Бернуллі» Чена та Лю. [5]

Кумулятивна функція розподілу

[ред. | ред. код]

Кумулятивну функцію розподілу (CDF) можна виразити як:

,

де — це множина всіх підмножин розміру 𝑙, які можна вибрати з колекції .

Властивості

[ред. | ред. код]

Середнє значення та дисперсія

[ред. | ред. код]

Оскільки змінна, що розподілена за законом біноміального розподілу Пуассона, є сумою незалежних змінних, що розподілені за законом Бернуллі, її середнє значення та дисперсія будуть просто сумою середнього значення та дисперсії цих розподілених змінних Бернуллі:

,
.

Для фіксованого середнього () та розміру (), дисперсія максимальна, коли всі ймовірності успіху однакові (біноміальний розподіл). Коли середнє значення фіксоване, дисперсія обмежена зверху дисперсією розподілу Пуассона з тим самим середнім значенням, яке досягається асимптотично при наближенні до нескінченності.

Нерівність Чернова

[ред. | ред. код]

Ймовірність того, що біноміальний розподіл Пуассона стає великим, може бути обмежена за допомогою його функції згортки моментів наступним чином (дійсна, коли і для будь-якого ):

де . Подібно до хвостових меж біноміального розподілу .

Обчислювальні методи

[ред. | ред. код]

За посиланням [6] наведене обговорення методу оцінки функції маси ймовірності біноміального розподілу Пуассона. На ньому базуються наступні програмні реалізації:

  • Пакет R poibin був наданий разом із документом [6], який доступний для обчислення cdf, pmf, квантильної функції та генерації випадкових чисел біноміального розподілу Пуассона. Для обчислення PMF можна вказати алгоритм DFT або рекурсивний алгоритм для обчислення точного PMF, а також можна вказати методи апроксимації з використанням нормального розподілу та розподілу Пуассона.
  • poibin — реалізація Python — може обчислювати PMF і CDF, для цього використовує метод DFT, описаний у статті.

Дивись також

[ред. | ред. код]

Список літератури

[ред. | ред. код]
  1. Wang, Y. H. (1993). On the number of successes in independent trials (PDF). Statistica Sinica. 3 (2): 295—312.
  2. Shah, B. K. (1994). On the distribution of the sum of independent integer valued random variables. American Statistician. 27 (3): 123—124. JSTOR 2683639.
  3. Chen, X. H.; A. P. Dempster; J. S. Liu (1994). Weighted finite population sampling to maximize entropy (PDF). Biometrika. 81 (3): 457. doi:10.1093/biomet/81.3.457.
  4. Fernandez, M.; S. Williams (2010). Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 46 (2): 803—817. Bibcode:2010ITAES..46..803F. doi:10.1109/TAES.2010.5461658.
  5. Chen, S. X.; J. S. Liu (1997). Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 7: 875—892.
  6. а б Hong, Yili (March 2013). On computing the distribution function for the Poisson binomial distribution. Computational Statistics & Data Analysis. 59: 41—51. doi:10.1016/j.csda.2012.10.006. Помилка цитування: Некоректний тег <ref>; назва «hong2013» визначена кілька разів з різним вмістом

[[Категорія:Факторіали і біноміальні коефіцієнти]] [[Категорія:Дискретні розподіли]]