Розподіл Діріхле

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

У теорії імовірностей і математичній статистиці розподіл Діріхле (за іменем Иоганна Петера Густава Лежен-Діріхле), позначають часто , - це сімейство безупинних багатомірних вірогідних розподілів параметризованных вектором не від’ємних дійсних чисел. Розподіл Діріхле є узагальненням Бета-розподілу на багатовимірний випадок. Тобто, його функція щільності повертає значення імовірності того, що імовірність кожного з K взаємновиключаючих подій дорівнює за умови, що кожна подія спостерігалася раз.

Функція щільності імовірності[ред.ред. код]

Функція щільності імовірності для розподілу Дирихле порядку K є:

де , , i .

Властивості[ред.ред. код]

Нехай i тоді

Модою розподілу є вектор x (x1, ...,xK) з

Розподіл Діріхле є сполученим апріорним розподілом до мультиноміального розподілу, а саме: якщо

де βі - число входжень і у вибірку з n крапок дискретного розподілу на {1, ..., K} визначеного через X, те

Цей зв'язок використовується в Байєсівскій статистиці для того, щоб оцінити сховані параметри, X, дискретного верогідного розподілу маючи набір з n вибірок. Очевидно, якщо апріорний розподіл позначений як Dir(α), те Dir(α+β) є апостеріорний розподіл після серії спостережень з гістограмою β.

Зв'язок з іншими розподілами[ред.ред. код]

Якщо для

незалежні, то

і

Попри те, що Xі не є незалежними один від одного, вони можуть бути згенерованні з набору з незалежних гама випадкових величин. Однак, тому що сума губиться в процесі формування X = (X1, ..., XK), стає неможливо відновити початкові значення гама випадкових величин тільки за цими значеннями. Проте, завдяки тому, що працювати з незалежними випадковими величинами простіше, це перетворення параметрів може бути корисно при доказі властивостей розподілу Діріхле.

Генерація випадкових чисел[ред.ред. код]

Метод побудови випадкового вектора для розподілу Дирихле розмірності K з параметрами випливає безпосередньо з цього зв'язку. Спочатку одержимо K незалежних випадкових вибірок з гамма-розподілів, кожне з який має щільність

а потім покладемо


Наочне трактування параметрів[ред.ред. код]

Як приклад використання розподілу Діріхле можна запропонувати задачу, у якій потрібно розрізати нитки (кожна початкової довжини 1.0) на K частин з різними довжинами так, щоб усі частини мали задану середню довжину, але з можливістю деякої варіації відносних довжин частин. Значення α/α0 визначають середні довжини частин нитки, що вийшли з розподілу. Дисперсія навколо середнього значення назад пропорційна α0.