Функція маси імовірності
У теорії ймовірностей та статистиці фу́нкція ма́си імові́рності[1] (англ. probability mass function, яку іноді називають функцією імовірності або функцією частоти, англ. probability function, frequency function[2]) — це функція, яка дає ймовірність того, що дискретна випадкова величина дорівнює певному значенню.[3] Іноді її також називають фу́нкцією густини́ дискре́тної імові́рності (англ. discrete probability density function). Функція маси ймовірності часто є основним засобом визначення дискретного розподілу ймовірності, й такі функції існують для скалярних та багатовимірних випадкових величин із дискретною областю визначення.
Функція маси ймовірності відрізняється від функції густини імовірності (ФГІ) тим, що остання пов'язана з неперервними випадковими величинами, а не з дискретними. Щоби вона давала ймовірність, ФГІ потрібно інтегрувати на проміжку.[4]
Значення випадкової величини, яке має найбільшу масу ймовірності, називають модою.
Функція маси ймовірності — це розподіл імовірності дискретної випадкової величини, вона подає можливі значення та їхні відповідні ймовірності. Це функція , визначена як
для ,[4] де — це міра ймовірності. також може бути спрощено записано як .[5]
Імовірності, пов'язані з усіма (гіпотетичними) значеннями, повинні бути невід'ємними, та давати в сумі 1:
і
Міркування про ймовірність як про масу допомагає уникати помилок, оскільки фізична маса зберігається, як і повна ймовірність для всіх гіпотетичних результатів .
Функцію маси ймовірності дискретної випадкової величини можливо розглядати як окремий випадок двох загальніших конструкцій теорії міри: розподілу та функції густини ймовірності щодо лічильної міри. Нижче наведено докладніше пояснення.
Припустімо, що — імовірнісний простір, а — вимірний простір, σ-алгебра в основі якого дискретна, зокрема містить одноелементні множини з . У цьому випадку випадкова величина дискретна, за умови що її образ зліченний. Образ міри , в цьому контексті званий розподілом , є ймовірнісною мірою на , обмеження якої на одноелементні множини породжує функцію маси ймовірності (як зазначено в попередньому розділі) , оскільки для кожного .
Тепер припустімо, що — простір з мірою з лічильною мірою . Функція густини ймовірності для щодо лічильної міри, якщо вона існує, є похідною Радона — Нікодима образу міри (щодо лічильної міри), тож , а є функцією з до невід'ємних дійсних чисел. Як наслідок, для будь-якого маємо
що показує, що є фактично функцією маси ймовірності.
Якщо існує природний порядок серед можливих значень , то може бути зручно призначити їм числові значення (або n-вимірні кортежі у випадку дискретної багатовимірної випадкової величини), і розглянути також значення, що не належать образові . Тобто, може бути визначено для всіх дійсних чисел, і для всіх , як показано на графіку.
Образ має зліченну підмножину, на якій функція маси ймовірності є одиницею. Як наслідок, функція маси ймовірності дорівнює нулеві для всіх, крім зліченної кількості значень .
Розривність функцій маси ймовірності пов'язана з тим, що інтегральна функція розподілу дискретної випадкової величини також розривна. Якщо — дискретна випадкова величина, то означає, що випадкова подія достовірна (відбувається у 100 % випадків); навпаки, означає, що випадкова подія неможлива. Це твердження не істинне для неперервної випадкової величини , для якої для будь-якого можливого . Процес перетворення неперервної випадкової величини на дискретну — це дискретування .
Є три основні пов'язані розподіли: розподіл Бернуллі, біноміальний розподіл та геометричний розподіл.
- Розподіл Бернуллі, ber(p), використовують для моделювання експерименту, що має лише два можливі результати. Ці два результати часто кодують як 1 та 0. Приклад розподілу Бернуллі — підкидання монети. Нехай — це вибірко́вий простір всіх результатів одиничного підкидання симетричної монети , а — випадкова величина, визначена на , яка призначує 0 категорії «реверс» і 1 категорії «аверс». Оскільки монета симетрична, функція маси ймовірності така:
- Біноміальний розподіл моделює кількість успіхів у разі спроб із вертанням. Кожна спроба або експеримент незалежна й має два можливі результати. Пов'язана з ним функція маси ймовірності виглядає як . Приклад біноміального розподілу — ймовірність отримати рівно одну 6 при підкиданні симетричної гральної кісточки тричі.
- Геометричний розподіл описує кількість спроб, необхідних для досягнення одного успіху. Його функція маси ймовірності виглядає як .Приклад — підкидання монети, поки не випаде перший аверс. позначує ймовірність результату «аверс», а — кількість необхідних підкидань монети. Інші розподіли, які можливо моделювати за допомогою функції маси ймовірності, — категорійний розподіл (відомий також як узагальнений розподіл Бернуллі) та поліноміальний розподіл.
- Якщо дискретний розподіл має дві або більше категорій, з яких може відбутися одна, незалежно від того, чи мають ці категорії природний порядок, і коли є лише одна спроба (витягування), то це категоріальний розподіл.
- Приклад багатовимірного дискретного розподілу та його функції маси ймовірності — поліноміальний розподіл. У ньому декілька випадкових величин відповідають кількостям успіхів у кожній з категорій після заданої кількості спроб, і кожна ненульова функція маси ймовірності дає ймовірність певної комбінації кількостей успіхів у різних категоріях.
Наведений нижче експоненційно спадний розподіл — приклад розподілу з нескінченним числом можливих результатів, усіма додатними цілими числами: Незважаючи на нескінченну кількість можливих результатів, сумарна маса ймовірності становить 1/2 + 1/4 + 1/8 + ⋯ = 1, що відповідає вимозі одиничної повної ймовірності для її розподілу.
Дві або більше дискретні випадкові величини мають спільну функцію маси ймовірності, яка задає ймовірність кожної можливої комбінації результатів для цих випадкових величин.
- ↑ Давиденко, Л. І.; Семенцов, Г. Н. (2013). Методи злиття даних для виявлення явища помпажу у відцентрових нагнітачах газоперекачувальних агрегатів. Науковий вісник Івано-Франківського національного технічного університету нафти і газу (укр.). ІФНТУНГ. 2: 174—180.
- ↑ 7.2 - Probability Mass Functions | STAT 414 - PennState - Eberly College of Science (англ.)
- ↑ Stewart, William J. (2011). Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling (англ.). Princeton University Press. с. 105. ISBN 978-1-4008-3281-1.
- ↑ а б A modern introduction to probability and statistics : understanding why and how (англ.). Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.
- ↑ Rao, Singiresu S. (1996). Engineering optimization : theory and practice (англ.) (вид. 3rd). New York: Wiley. ISBN 0-471-55034-5. OCLC 62080932.
- Johnson, N. L.; Kotz, S.; Kemp, A. (1993). Univariate Discrete Distributions (англ.) (вид. 2nd). Wiley. с. 36. ISBN 0-471-54897-9.