Розподіл Діріхле

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Розподіл Діріхле
Multiple probability density functions for Dirichlet distributions on the 2-simplex.
Параметри число категорій (ціле)
параметри концентрації, де
Носій функції where and
Розподіл імовірностей
де
де
Середнє

(див. Дигамма-функція)
Мода
Дисперсія
де і
Ентропія
при визначина як для варіації вище.
Твірна функція моментів (mgf) {{{mgf}}}
Характеристична функція {{{char}}}

У теорії імовірностей і математичній статистиці розподіл Діріхле (за іменем Йоганна Петера Густава Лежьона-Діріхле), позначають часто — це сімейство безупинних багатовимірних вірогідних розподілів невід’ємних дійсних чисел, параметризованих вектором . Розподіл Діріхле є узагальненням Бета-розподілу на багатовимірний випадок. Тобто, його функція щільності повертає значення імовірності того, що імовірність кожного з K взаємновиключних подій дорівнює за умови, що кожна подія спостерігалася раз.

Функція щільності імовірності[ред. | ред. код]

Функція щільності імовірності для розподілу Діріхле порядку K має вигляд:

де , , i .

Властивості[ред. | ред. код]

Нехай i тоді

Модою розподілу є вектор з

Розподіл Діріхле є сполученим апріорним розподілом до мультиноміального розподілу, а саме: якщо

де - число входжень і у вибірку з n точок дискретного розподілу на {1, ..., K}, визначеного через X, то

Цей зв'язок використовується в Байєсівській статистиці для того, щоб оцінити приховані параметри дискретного імовірносного розподілу , маючи набір з n вибірок. Очевидно, якщо апріорний розподіл позначений як , то - це апостеріорний розподіл після серії спостережень з гістограмою .

Зв'язок з іншими розподілами[ред. | ред. код]

Якщо для

незалежні, то

і

Попри те, що Xі не є незалежними один від одного, вони можуть бути згенерованні з набору з незалежних гама випадкових величин. Однак, тому що сума губиться в процесі формування , стає неможливо відновити початкові значення гамма-випадкових величин тільки за цими значеннями. Проте, завдяки тому, що працювати з незалежними випадковими величинами простіше, це перетворення параметрів може бути корисно при доведенні властивостей розподілу Діріхле.

Генерація випадкових чисел[ред. | ред. код]

Метод побудови випадкового вектора для розподілу Діріхле розмірності K з параметрами випливає безпосередньо з цього зв'язку. Спочатку одержимо K незалежних випадкових вибірок з гамма-розподілів, кожен з який має щільність

а потім покладемо


Наочне трактування параметрів[ред. | ред. код]

Як приклад використання розподілу Діріхле можна запропонувати задачу, у якій потрібно розрізати нитки (кожна початкової довжини 1.0) на K частин з різними довжинами так, щоб усі частини мали задану середню довжину, але з можливістю деякої варіації відносних довжин частин. Значення α/α0 визначають середні довжини частин нитки, що вийшли з розподілу. Дисперсія навколо середнього значення зворотньо пропорційна α0.

Ланки[ред. | ред. код]

  • Hazewinkel, Michiel, ред. (2001), Dirichlet distribution, Математична енциклопедія, Springer, ISBN 978-1-55608-010-4
  • Dirichlet Distribution [Архівовано 13 лютого 2010 у Wayback Machine.]
  • How to estimate the parameters of the compound Dirichlet distribution (Pólya distribution) using expectation-maximization (EM) [Архівовано 19 січня 2022 у Wayback Machine.]
  • Luc Devroye. Non-Uniform Random Variate Generation. Архів оригіналу за 17 липня 2012. Процитовано 19 жовтня 2019.
  • Dirichlet Random Measures, Method of Construction via Compound Poisson Random Variables, and Exchangeability Properties of the resulting Gamma Distribution [Архівовано 20 січня 2022 у Wayback Machine.]
  • SciencesPo [Архівовано 25 лютого 2021 у Wayback Machine.]: R package that contains functions for simulating parameters of the Dirichlet distribution.