Розподіл Діріхле

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

У теорії імовірностей і математичній статистиці розподіл Діріхле (за іменем Иоганна Петера Густава Лежен-Діріхле), позначають часто Dir(\alpha), - це сімейство безупинних багатомірних вірогідних розподілів параметризованных вектором \alpha не від’ємних дійсних чисел. Розподіл Діріхле є узагальненням Бета-розподілу на багатовимірний випадок. Тобто, його функція щільності повертає значення імовірності того, що імовірність кожного з K взаємновиключаючих подій дорівнює x_i за умови, що кожна подія спостерігалася \alpha_i-1 раз.

Функція щільності імовірності[ред.ред. код]

Функція щільності імовірності для розподілу Дирихле порядку K є:

f(x_1, \dots, x_K; \alpha_1, \dots, \alpha_K) =\frac{1}{\mathrm{B}(\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1}

де x_i \ge 0\,, \sum_{i=1}^K x_i = 1\,, i \alpha_i \ge 0\,.

Властивості[ред.ред. код]

Нехай X = (X_1, \ldots,X_K)\sim\operatorname{Dir}(\alpha) i \alpha_0 =\sum_{i=1}^K\alpha_i, тоді

\mathrm{E}[X_i|\alpha] = \frac{\alpha_i}{\alpha_0},
\mathrm{Var}[X_i|\alpha] = \frac{\alpha_i(\alpha_0-\alpha_i)}{\alpha_0^2 (\alpha_0+1)},
\mathrm{Cov}[X_iX_j|\alpha] = \frac{- \alpha_i\alpha_j}{\alpha_0^2 (\alpha_0+1)}.

Модою розподілу є вектор x (x1, ...,xK) з

 x_i = \frac{\alpha_i - 1}{\alpha_0 - K}, \quad \alpha_i > 1.

Розподіл Діріхле є сполученим апріорним розподілом до мультиноміального розподілу, а саме: якщо

\beta|X=(\beta_1, \ldots, \beta_{K})|X \sim\operatorname{Mult}(X),

де βі - число входжень і у вибірку з n крапок дискретного розподілу на {1, ..., K} визначеного через X, те

X | \beta \sim \operatorname{Dir}(\alpha + \beta).

Цей зв'язок використовується в Байєсівскій статистиці для того, щоб оцінити сховані параметри, X, дискретного верогідного розподілу маючи набір з n вибірок. Очевидно, якщо апріорний розподіл позначений як Dir(α), те Dir(α+β) є апостеріорний розподіл після серії спостережень з гістограмою β.

Зв'язок з іншими розподілами[ред.ред. код]

Якщо для i\in\{1,2,\ldots,K\},

Y_i\sim\operatorname{Gamma}(\textrm{shape}=\alpha_i,\textrm{scale}=1) незалежні, то
V=\sum_{i=1}^KY_i\sim\operatorname{Gamma}(\textrm{shape}=\sum_{i=1}^K\alpha_i,\textrm{scale}=1),

і

(X_1,\ldots,X_K) = (Y_1/V,\ldots,Y_K/V)\sim\operatorname{Dir}(\alpha_1,\ldots,\alpha_K).

Попри те, що Xі не є незалежними один від одного, вони можуть бути згенерованні з набору з K незалежних гама випадкових величин. Однак, тому що сума V губиться в процесі формування X = (X1, ..., XK), стає неможливо відновити початкові значення гама випадкових величин тільки за цими значеннями. Проте, завдяки тому, що працювати з незалежними випадковими величинами простіше, це перетворення параметрів може бути корисно при доказі властивостей розподілу Діріхле.

Генерація випадкових чисел[ред.ред. код]

Метод побудови випадкового вектора x=(x_1, \ldots, x_K) для розподілу Дирихле розмірності K з параметрами (\alpha_1, \ldots, \alpha_K) випливає безпосередньо з цього зв'язку. Спочатку одержимо K незалежних випадкових вибірок y_1, \ldots, y_K з гамма-розподілів, кожне з який має щільність

 \frac{y_i^{\alpha_i-1} \; e^{-y_i}}{\Gamma (\alpha_i)}, \!

а потім покладемо

x_i = y_i/\sum_{j=1}^K y_j. \!


Наочне трактування параметрів[ред.ред. код]

Як приклад використання розподілу Діріхле можна запропонувати задачу, у якій потрібно розрізати нитки (кожна початкової довжини 1.0) на K частин з різними довжинами так, щоб усі частини мали задану середню довжину, але з можливістю деякої варіації відносних довжин частин. Значення α/α0 визначають середні довжини частин нитки, що вийшли з розподілу. Дисперсія навколо середнього значення назад пропорційна α0.