Густина імовірності

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Коробковий графік і функція густини імовірності для нормального розподілу N(0, σ2).

Густина імовірності або щільність неперервної випадкової величини — це функція, що визначає ймовірнісну міру відносної правдоподібності, того що значення випадкової величини буде відповідати заданій події, для кожної окремої події (або точки) у просторі подій (множини всіх можливих значень, які може приймати випадкова величина). Іншими словами, в той час як абсолютна правдоподібність що неперервна випадкова величина може прийняти одне конкретне значення дорівнює 0 (оскільки існує нескінченна множина можливих значень), значення функції щільності в двох окремих точках можна використати аби припустити, наскільки імовірніше ця випадкова величина дорівнювати одному значенню в порівнянні з іншим.

У більш точному розумінні, функція густини імовірності використовується для визначення ймовірність того, що випадкова величина потрапить у заданий діапазон значень, замість того щоб визначати чи прийме вона одне конкретне значення. Ця ймовірність задається за допомогою інтеграла функції густини цієї величини по тому діапазону—тобто, вона задає площу що обмежена функцією густини і горизонтальною віссю координат і обмеженою заданим діапазоном. Функція густини імовірностей є невід'ємною по всій області визначення, а її інтеграл по всьому простору подій дорівнює одиниці.

У випадку, коли ймовірнісна міра є розподілом випадкової величини, говорять про щільність випадкової величини.

Приклад[ред. | ред. код]

Припустимо, що представники бактерій зазвичай живуть від 4 до 6 годин. Яка ймовірність того, що бактерія житиме точно 5 годин? Відповідь - ця імовірність дорівнює 0%. Багато бактерій житимуть приблизно 5 годин, але немає ймовірності, що будь-яка окрема бактерія проживе точно 5.0000000000... годин.

Замість того можна поставити питання: Яка імовірність того, що бактерія проживе часу від 5 годин до 5.01 годин? Допустимо ця імовірність становить 0.02 (тобто, 2%). Далі, а яка імовірність що бактерія проживе від 5 годин до 5.001 годин? Оскільки інтервал в десять разів менший за попередній, ця імовірність дорівнюватиме 0.002. Ймовірність того, що бактерія житиме від 5 годин до 5.0001 годин повинна дорівнювати близько 0.0002, і так далі.

В цих трьох прикладах, відношення (імовірності прожити кількість часу у заданому інтервалі) до (величини цього інтервалу) приблизно є сталим, і дорівнює 2 на годину (або 2 hour−1). Наприклад, ймовірність, що якась бактерія загине у інтервалі довжиною 0.01-годин між 5 і 5.01 годинами життя дорівнює 0.02, а (ймовірність 0.02 / 0.01 годин) = 2 години−1. Ця величина 2 години−1 називається густиною імовірності того, що бактерія проживе близько 5 годин.

Щодо відповіді на питання "Яка імовірність того, що бактерія загине проживши рівно 5 годин?", правильна, але мало зрозуміла відповідь - "0", але кращу відповідь можна записати як (2 години−1) dt. Це імовірність того, що бактерія загине у нескінченно малому проміжку довкола 5 годин, де dt це величина цього проміжку.

Наприклад, ймовірність того, що вона проживе довше 5 годин, але менше ніж (5 годин + 1 наносекунда), дорівнює (2 години−1)×(1 наносекунда) ≃ 6×10−13 (якщо застосувати приведення одиниць вимірювання 3.6×1012 наносекунд = 1 годині).

Це є функцією густини імовірностей f де f(5 годин) = 2 години−1. Інтеграл функції f по заданому діапазону часу (не лише для нескінченно малого діапазону, але і для великих діапазонів значень) є імовірністю, що бактерія проживе задану кількість часу в даному інтервалі.

Означення[ред. | ред. код]

Абсолютно неперервний розподіл однієї величини[ред. | ред. код]

Функція густини імовірності зазвичай пов'язана із абсолютно неперервним розподілом однієї випадкової величини. Випадкова величина X буде мати функцію густини fX, якщо:

де fX — невід'ємна інтегровна за Лебегом функція, яка називається функцією густини імовірності випадкової величини X.

Якщо FX це кумулятивна функція розподілу величини X, тоді:

і (якщо fX є неперервною в точці x)

Інтуїтивно, можна розуміти, що fX(x) dx є імовірністю того, що X потрапить у нескінченно малий інтервал [xx + dx].

Формальне визначення[ред. | ред. код]

(Це визначення можна застосувати до будь-якого розподілу імовірностей застосовуючи визначення імовірності на основі теорії мір множин.)

Випадкова величина X, що приймає значення із вимірного простору (зазвичай , де вимірними підмножинами є Борелівські множини) і її розподілом ймовірностей є міра XP по : густиною X по відношенню до еталонної міри μ по є похідна Радона — Нікодима:

Це означає, f є будь-якою вимірною функцією із наступною властивістю:

для будь-якої вимірної множини .

Для наведеного вище випадку із неперервним розподілом однієї змінної, еталонною мірою є міра Лебега. Функція маси імовірностей для дискретної випадкової величини є густиною по відношенню до лічильної міри по простору подій (зазвичай це є множина цілих чисел, або деяка її підмножина).

Зауваження[ред. | ред. код]

  • Функція густини імовірності існує лише для абсолютно неперервних випадкових величин.
  • У квантовiй механiцi — вiдношення ймовiрностi знаходження системи в даному елементi об'єму до величини цього елемента об'єму; розраховується як квадрат модуля хвильової функцiї системи (добуток хвильової функції та її комплексно спряженої функції).

Властивості[ред. | ред. код]

Інші особливості[ред. | ред. код]

На відміну від функції розподілу імовірностей, функція густини імовірностей може приймати значення більші за одиницю; наприклад, рівномірний розподіл в інтервалі [0, ½] має густину імовірності f(x) = 2 для 0 ≤ x ≤ ½ і f(x) = 0 для інших значень.

Стандартний нормальний розподіл має густину імовірності

Якщо дано випадкову величину X і її розподіл дозволяє визначити функцію густини імовірностей f, тоді математичне сподівання для X (якщо воно існує) можна розрахувати наступним чином

Не кожний ймовірнісний розподіл матиме функцію густини, розподіли дискретних випадкових величин не матимуть її; а також її не існує для розподілу Кантора[en], не дивлячись на те, що він не має дискретних елементів, тобто не призначає додатного значення імовірності для жодної окремої точки розподілу.

Розподіл має функцію густини тоді і тільки тоді, коли його функція розподілу ймовірностей F(x) абсолютно неперервна. У такому випадку: F майже скрізь диференційована, а її похідна може використовуватися як функція густини імовірностей:

Якщо розподіл має функцію густини, тоді ймовірність у кожній обраній окремій точці {a} дорівнює нулю; те саме стосується скінченних і зліченних множин точок.

Дві функції густини імовірностей f і g задають той самий розподіл ймовірностей, коли вони відрізняються лише на множину нульової міри Лебега.

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]