Математичне сподівання

Математи́чне сподіва́ння,^[1] сере́днє зна́чення — одна з основних числових характеристик кожної випадкової величини. Воно є узагальненим поняттям середнього значення сукупності чисел на той випадок, коли елементи множини значень цієї сукупності мають різну «вагу», ціну, важливість, пріоритет, що є характерним для значень випадкової змінної^[2]. В теорії ймовірностей, математичне сподівання випадкової величини, інтуїтивно, є середнім значенням при довгостроковому повторенні одного і того ж експеримента, який воно представляє. Наприклад, математичне сподівання при підкиданні шестигранної гральної кісточки становить 3,5, оскільки середнє значення з усіх чисел, які можуть випасти становить 3,5 із тим як кількість підкидань прямує до нескінченності. Іншими словами, закон великих чисел стверджує, що середнє арифметичне всіх значень майже певно збігається до математичного сподівання, із тим як кількість повторів даного експерименту прямує до нескінченності. Математичне сподівання також іноді називають сподіванням, середнім, середнім значенням, або першим моментом.

Оскільки, випадкова величина може бути дискретною або задана густиною розподілу ймовірностей, тому теорія ймовірностей наводить два означення математичного сподівання. У більш практичному розумінні, математичне сподівання дискретної випадкової величини є середнім зваженим по імовірності для всіх можливих значень. Іншими словами, кожне можливе значення випадкової величини фактично є помножене на його імовірність виникнення, і отриманий добуток складається у загальну суму, яка утворює математичне сподівання. Той самий принцип застосовується і для абсолютно неперервних випадкових величин, за винятком того, що сума замінюється на інтеграл для даної випадкової величини, по відношенню до її функції густини імовірностей. Формальне визначення охоплює обидва ці випадки, а також передбачає розподіли, які не є ні дискретними ні абсолютно неперервними; математичне сподівання випадкової величини є інтегралом, аргументом якого є ця випадкова величина відповідно до її міри імовірності^[3]^[4].

Математичне сподівання не існує для випадкових величин, що мають певні розподіли імовірностей із великими "хвостами"^[en], як наприклад, Розподіл Коші.^[5] Для таких випадкових величин, довгий хвіст розподілу не передбачає, що сума або інтеграл будуть збіжними.

Математичне сподівання є ключовим аспектом, який характеризує розподіл ймовірностей; воно є одним із різновидів коефіцієнта зсуву. На противагу йому, дисперсія є мірою розсіяння можливих значень випадкової величини довкола математичного сподівання. Дисперсія сама по собі визначається в термінах двох математичних сподівань: це математичне сподівання квадратичного відхилення значень випадкової величини від математичного сподівання.

Означення 1[ред. | ред. код]

Нехай дискретна випадкова змінна $X$ може набувати значення $x_{1},x_{2},\ldots ,$ відповідно з ймовірностями $p(x_{1}),p(x_{2}),\ldots ,$ причому $\sum _{x}p(x)=1\,$ .

Означення Чебишова: Математичним сподіванням будь-якої величини називається сума всіх можливих для неї значень, помножених на їхні ймовірності:^[6]

\mu \,\equiv \operatorname {E} (X)=\sum _{x}x\,p(x)

,

де

\mu \,

— це середнє значення випадкової величини

X

, областю можливих значень якої є множина

\left\{X=x\right\}

;

\operatorname {E}

— оператор математичного сподівання;

\operatorname {E} (X)

— математичне сподівання величини

X

.

Ілюстрація збіжності середнього для послідовності кидання грального кубика до сподівання 3.5 при постійному збільшенні кількості спроб.

Приклади[ред. | ред. код]

Нехай $X$ задає множину подій при підкиданні гральної кістки із шістьма сторонами. Результатом буде кількість точок на верхній грані після підкидання гральної кістки. Можливими значеннями, які прийматиме $X$ є 1, 2, 3, 4, 5, і 6, всі є рівноймовірними (кожне значення має ймовірність ¹⁄₆). Математичним сподіванням для $X$ буде

\operatorname {E} [X]=1\cdot {\frac {1}{6}}+2\cdot {\frac {1}{6}}+3\cdot {\frac {1}{6}}+4\cdot {\frac {1}{6}}+5\cdot {\frac {1}{6}}+6\cdot {\frac {1}{6}}=3.5.

Якщо підкинути гральну кістку

n

разів і розрахувати середнє (середнє арифметичне) всіх результатів, із збільшенням

n

, середнє буде майже певне збігатися до значення сподівання. Цей факт відомий як закон великих чисел. Одним із прикладів послідовності десяти випадань гральної кістки є 2, 3, 1, 2, 5, 6, 2, 2, 2, 6, для якого середнє буде дорівнювати 3.1, що відрізняється від математичного сподівання 3.5 на число 0.4. Зближення є відносно повільним: ймовірність що середнє знаходитиметься в межах

3.5 \pm 0.1

дорівнює 21.6 % для десяти спроб, 46.1 % для сотні спроб і 93.7 % для тисячі спроб. Див. графік на якому показані середні для довших послідовностей кидання гральної кістки на якому видно як вони збігаються до математичного сподівання із значенням в 3.5. У загальному випадку, швидкість зближення можна приблизно розрахувати за допомогою, наприклад, нерівності Чебишова і теореми Беррі-Ессіна^[en].

При грі в рулетку невелика кулька може потрапити в одну із 38 пронумерованих секцій колеса, що розміщені по колу. Коли колесо розкручують кулька ударяється і рухається випадковим чином доки не зупиниться в одному з секторів. Нехай випадкова величина $X$ задає (грошовий) виграш при ставці в $1 на одне число («пряма» ставка). Якщо ставка виграє (що трапиться із ймовірністю ¹⁄₃₈), виграш становитиме $35; в іншому випадку гравець втрачає ставку. Очікуваним прибутком від такої ставки буде

\operatorname {E} [\,{\text{gain from }}\$1{\text{ bet}}\,]=-\$1\cdot {\frac {37}{38}}+\$35\cdot {\frac {1}{38}}=-\$0.0526.

Тобто, ставка в $1 коштуватиме втраті $0.0526, точніше її сподіванням є -$0.0526.

Означення 2[ред. | ред. код]

Нехай випадкова змінна $\xi$ задана густиною розподілу ймовірностей : $p_{\xi }(x)\,$ , $(x_{min}<x<x_{max})$ .

Математичним сподіванням такої числової змінної $\xi$ , якщо воно існує, називають інтеграл, узятий по області існування її густини розподілу, від добутку цієї випадкової змінної на її густину розподілу, тобто:

\mu \equiv \,\operatorname {E} (\xi )=\int _{X}xp_{\xi }(x)dx

.

Математичне подівання існує, якщо цей інтеграл абсолютно збіжний.

Деякі формули для обчислення математичного сподівання[ред. | ред. код]

Абстрактний інтеграл, що фігурує в означенні математичного сподівання, можна замінити відповідним інтегралом Лебега-Стілтьєса. Розглянемо випадок композиції борелівської функції $f$ та випадкової величини $\xi$ :

\operatorname {E} (f\circ \xi )=\int _{X}f(x)dF_{\xi }(x)

,

де $F_{\xi }(x)$ — функція розподілу випадкової величини $\xi$ .

Від цієї залежності приходимо до такої формули:

\operatorname {E} (\xi )=\int _{X}xdF_{\xi }(x)

Основні властивості математичного сподівання[ред. | ред. код]

Якщо $\displaystyle \xi$ та $\displaystyle \eta$ — незалежні інтегровні випадкові величини, то $\displaystyle \operatorname {E} (\xi \cdot \eta )=\operatorname {E} (\xi )\cdot \operatorname {E} (\eta )$ .
Якщо $\displaystyle \xi$ та $\displaystyle \eta$ — інтегровні випадкові величини, то $\displaystyle \operatorname {E} (\xi +\eta )=\operatorname {E} (\xi )+\operatorname {E} (\eta )$ .
Якщо $\displaystyle \xi$ — інтегровна випадкова величина, $C\in \mathbb {R}$ то $\operatorname {E} (C\xi )=C\cdot \operatorname {E} (\xi )$ .

Нижченаведені властивості повторюють властивості інтеграла Лебега, або безпосередньо випливають із них.

$\operatorname {E} [{\mathbf {1} }_{A}]=\operatorname {P} (A)$ [ред. | ред. код]

Якщо $A$ є випадковою подією, тоді $\operatorname {E} [{\mathbf {1} }_{A}]=\operatorname {P} (A),$ де ${\mathbf {1} }_{A}$ це індикаторна функція для множини $A$ .

Доведення. За визначенням інтеграла Лебега для простої функції ${\mathbf {1} }_{A}={\mathbf {1} }_{A}(\omega )$ ,

\operatorname {E} [{\mathbf {1} }_{A}]=1\cdot \operatorname {P} (A)+0\cdot \operatorname {P} (\Omega \setminus A)=\operatorname {P} (A).

Якщо X = Y тоді E[X] = E[Y][ред. | ред. код]

Це твердження випливає із визначення інтеграла Лебега, якщо взяти до уваги, що $X_{+}=Y_{+}$ , $X_{-}=Y_{-}$ , і що заміна простої випадкової величини на множину із нульовою імовірністю не змінює математичного сподівання.

Математичне сподівання для сталої[ред. | ред. код]

Якщо $X$ це випадкова величина, і $X=c$ , де $c\in [-\infty ,+\infty ]$ , тоді $\operatorname {E} [X]=c$ . Зокрема, для довільної випадкової величини $X$ , $\operatorname {E} [\operatorname {E} [X]]=\operatorname {E} [X]$ .

Доведення.

Нехай $C$ — це стала випадкова величина, тобто $C\equiv c$ . З визначення інтеграла Лебега випливає, що $\operatorname {E} [C]=c$ . Також випливає, що $X=C$ . Із попередньої властивості,

\operatorname {E} [X]=\operatorname {E} [C]=c.

Лінійність[ред. | ред. код]

Оператор математичного сподівання $\operatorname {E} [\cdot ]$ є лінійним в тому сенсі, що

{\begin{aligned}\operatorname {E} [X+Y]&=\operatorname {E} [X]+\operatorname {E} [Y],\\[6pt]\operatorname {E} [aX]&=a\operatorname {E} [X],\end{aligned}}

де $X$ і $Y$ є (довільними) випадковими величинами, і $a$ є скаляром.

Більш суворо, нехай $X$ і $Y$ — випадкові величини, які мають визначені математичні сподівання (що відмінні від $\infty -\infty$ ).

Якщо $\operatorname {E} [X]+\operatorname {E} [Y]$ також визначене (тобто відмінне від $\infty -\infty$ ), тоді

\operatorname {E} [X+Y]=\operatorname {E} [X]+\operatorname {E} [Y].

нехай $\operatorname {E} [X]$ є скінченним, а $a\in \mathbb {R}$ є скінченним скаляром. Тоді $\operatorname {E} [aX]=a\operatorname {E} [X].$

Доведення.

1. Доведемо адитивність за допомогою декількох кроків.

1a. Якщо $X$ і $Y$ є простими і невід'ємними, знаходячи перетини де це необхідно, перепишемо $X$ і $Y$ у наступному вигляді

X=\sum _{i=1}^{n}x_{i}\cdot {\mathbf {1} }_{A_{i}}

і

Y=\sum _{i=1}^{n}y_{i}\cdot {\mathbf {1} }_{A_{i}},

для деяких вимірних попарно-непересічних множин $\{A_{i}\}_{i=1}^{n}$ розбиття $\Omega$ , і ${\mathbf {1} }_{A_{i}}={\mathbf {1} }_{A_{i}}(\omega )$ буде індикаторною функцією для множини $A_{i}$ . Адитивність випливає із перевірки прямим методом.

1b. Припустимо, що $X$ і $Y$ є довільними не від'ємними величинами. Зауважимо, що кожна не-від'ємна вимірна функція є поточковою границею для поточкової не спадної послідовності із простих не від'ємних функцій. Нехай $\{X_{n}\}$ і $\{Y_{n}\}$ є такими послідовностями, які збігаються до $X$ і $Y,$ відповідно. Ми бачимо, що $\{X_{n}+Y_{n}\}$ поточково не спадає, і $X_{n}+Y_{n}\to X+Y$ поточково. Відповідно до Теореми Леві про монотонну збіжність і випадку 1a,

{\begin{aligned}\operatorname {E} [X+Y]&=\operatorname {E} [\lim _{n}(X_{n}+Y_{n})]\\&=\lim _{n}\operatorname {E} [X_{n}+Y_{n}]\\&=\lim _{n}(\operatorname {E} [X_{n}]+\operatorname {E} [Y_{n}])\\&=\lim _{n}\operatorname {E} [X_{n}]+\lim _{n}\operatorname {E} [Y_{n}]\\&=\operatorname {E} [\lim _{n}X_{n}]+\operatorname {E} [\lim _{n}Y_{n}]\\&=\operatorname {E} [X]+\operatorname {E} [Y].\end{aligned}}

(За допомогою теореми про монотонну збіжність можна перевірити, що це не веде до кругової логіки).

1c. В загальному випадку, якщо $Z=X+Y$ , тоді $Z_{+}+X_{-}+Y_{-}=Z_{-}+X_{+}+Y_{+},$ and

\operatorname {E} [Z_{+}+X_{-}+Y_{-}]=\operatorname {E} [Z_{-}+X_{+}+Y_{+}].

Розділивши це,

\operatorname {E} [Z_{+}]+\operatorname {E} [X_{-}]+\operatorname {E} [Y_{-}]=\operatorname {E} [Z_{-}]+\operatorname {E} [X_{+}]+\operatorname {E} [Y_{+}],

що еквівалентно,

\operatorname {E} [Z_{+}]-\operatorname {E} [Z_{-}]=\operatorname {E} [X_{+}]+\operatorname {E} [Y_{+}]-\operatorname {E} [X_{-}]-\operatorname {E} [Y_{-}],

і зрештою,

\operatorname {E} [Z]=\operatorname {E} [X]+\operatorname {E} [Y].

2. Для доведення однорідності, припустимо спершу, що скаляр $a$ описаний перед цим не від'ємний. Скінченність $\operatorname {E} [X]$ передбачає, що $X$ також є скінченним. Тому, $a\cdot X$ також скінченне, що зрештою гарантує, що $\operatorname {E} [aX]$ є скінченним. Рівняння, таким чином, є простою перевіркою, що основана на визначенні інтеграла Лебега.

Якщо $a<0$ , тоді спершу доведемо, що $\operatorname {E} [-X]=-\operatorname {E} [X]$ спостерігаючи, що $(-X)_{+}=X_{-}$ і навпаки.

E[X] існує і є скінченним тоді і тільки тоді, коли E[|X|] є скінченним[ред. | ред. код]

Такі твердження відносно випадкової величини $X$ — еквівалентні:

$\operatorname {E} [X]$ існує і є скінченним.
Обидва $\operatorname {E} [X_{+}]$ і $\operatorname {E} [X_{-}]$ є скінченними.
$\operatorname {E} [|X|]$ скінченне.

Насправді, $|X|=X_{+}+X_{-}$ . Відповідно до властивості лінійності, $\operatorname {E} [|X|]=\operatorname {E} [X_{+}]+\operatorname {E} [X_{-}]$ . Вищенаведена рівність спирається на визначення інтегралу Лебега і вимірність $X$ .

Завдяки цьому, вирази про те що « $X$ є інтегрованою» і «математичне сподівання $X$ є скінченним» є зрештою взаємозамінними, якщо говорять про випадкову величину.

Якщо X ≥ 0 тоді E[X] ≥ 0[ред. | ред. код]

Доведення.

Позначимо

\operatorname {SF} =\{s:\Omega \to \mathbb {R} \mid s{\text{ є простою випадковою величиною, і }}0\leq s\leq X_{+}\}.

Якщо $s\in \operatorname {SF}$ , тоді $\operatorname {E} [s]\in [0,+\infty )$ , і звідси, за визначенням інтеграла Лебега,

\operatorname {E} [X_{+}]=\sup _{s\in \operatorname {SF} }\operatorname {E} [s]\geq 0.

З іншого боку, $X_{-}=0$ (майже скрізь), тож, якщо задати через подібний аргумент, $\operatorname {E} [X_{-}]=0$ , і таким чином $\operatorname {E} [X]=\operatorname {E} [X_{+}]-\operatorname {E} [X_{-}]=\operatorname {E} [X_{+}]\geq 0$ .

Монотонність[ред. | ред. код]

Якщо $X\leq Y$ (a.s.), і обидва $\operatorname {E} [X]$ та $\operatorname {E} [Y]$ існують, тоді $\operatorname {E} [X]\leq \operatorname {E} [Y]$ .

Зауваження. $\operatorname {E} [X]$ and $\operatorname {E} [Y]$ існую в тому розумінні, що $\min(\operatorname {E} [X_{+}],\operatorname {E} [X_{-}])<\infty$ and $\min(\operatorname {E} [Y_{+}],\operatorname {E} [Y_{-}])<\infty .$

Доведення випливає із властивості лінійності і попередньої властивості, якщо задати $Z=Y-X$ і звернути увагу на те, що $Z\geq 0$ (майже скрізь).

Якщо $|X|\leq Y$ (майже скрізь) і $\operatorname {E} [Y]$ є скінченною, тоді так само і для $\operatorname {E} [X]$ [ред. | ред. код]

Нехай $X$ і $Y$ є випадковими величинами, такими що $|X|\leq Y$ (майже скрізь) і $\operatorname {E} [Y]<\infty$ . Тоді $\operatorname {E} [X]\neq \pm \infty$ .

Доведення. Завдяки не від'ємності $|X|$ , $\operatorname {E} |X|$ існує, скінченне або нескінченне. Відповідно до властивості монотонності, $\operatorname {E} |X|\leq \operatorname {E} [Y]<\infty$ , тож $\operatorname {E} |X|$ є скінченним, що в свою чергу як ми бачили буде еквівалентне тому, що $\operatorname {E} [X]$ є скінченним.

Якщо $\operatorname {E} |X^{\beta }|<\infty$ та $0<\alpha <\beta$ тоді $\operatorname {E} |X^{\alpha }|<\infty$ [ред. | ред. код]

Нижченаведене твердження буде використане для доведення властивості екстремальності для $\operatorname {E} [X]$ .

Твердження. Якщо $X$ є випадковою величиною, тоді так само буде і $X^{\alpha }$ , для будь-якого $\alpha >0$ . Якщо в додаток до того, $\operatorname {E} |X^{\beta }|<\infty$ і $0<\alpha <\beta$ , тоді $\operatorname {E} |X^{\alpha }|<\infty$ .

Доведення.
Аби зрозуміти чому перше твердження є справедливим, зауважимо, що $X^{\alpha }$ є композицією із $X$ та $x\mapsto x^{\alpha }$ . Оскільки це буде композицією двох вимірних функцій, то $X^{\alpha }$ також є вимірною. Аби довести друге твердження, визначимо $Y(\omega )=\max(\|X(\omega )\|^{\beta },1).$ Можна перевірити, що $Y$ є випадковою величиною і $\|X\|^{\alpha }\leq Y$ . Відповідно до властивості невід'ємності, ${\begin{aligned}\operatorname {E} [Y]&=\int \limits _{\{\omega \ \mid \ \|X(\omega )\|^{\beta }\leq 1\}}Y\,dP+\int \limits _{\{\omega \ \mid \ \|X(\omega )\|^{\beta }>1\}}Y\,dP\\[6pt]&=\operatorname {P} {\bigl (}\|X(\omega )\|^{\beta }\leq 1{\bigr )}+\int \limits _{\{\omega \ \mid \ \|X(\omega )\|^{\beta }>1\}}\|X\|^{\beta }\,dP\\[6pt]&\leq 1+\operatorname {E} \|X^{\beta }\|<\infty .\end{aligned}}$ Відповідно до властивості монотонності, $\operatorname {E} \|X^{\alpha }\|\leq \operatorname {E} [Y]\leq 1+\operatorname {E} \|X^{\beta }\|<\infty .$

Протилежний приклад для нескінченної міри[ред. | ред. код]

Вимога, що $\operatorname {P} (\Omega )<\infty$ є суттєвою. Як протилежний приклад розглянемо вимірний простір

([1,+\infty ),{\mathcal {B}}_{\mathbb {R} _{[1,+\infty )}},\lambda ),

де ${\mathcal {B}}_{\mathbb {R} _{[1,+\infty )}}$ це Борелівська $\sigma$ -алгебра над інтервалом $[1,+\infty ),$ і $\lambda$ є лінійною мірою Лебега. Можна довести, що $\textstyle \int _{[1,+\infty )}{\frac {1}{x}}\,dx=\infty ,$ навіть якщо $\textstyle \int _{[1,+\infty )}{\frac {1}{x^{2}}}\,dx=1.$ ( $\textstyle \int _{S}{\frac {1}{x}}\,dx$ і $\textstyle \int _{S}{\frac {1}{x^{2}}}\,dx$ визначають міру $\mu$ над $\textstyle [1,+\infty )=\cup _{n=1}^{\infty }[1,n].$ Зважаючи на неперервність для $\mu$ і спростивши інтеграл Рімана для кожного скінченного інтервала $[1,n]$ ), отримаємо необхідне доведення.

Властивість екстремальності[ред. | ред. код]

Відповідно до того, що було доведено вище, якщо $X$ це випадкова змінна, тоді так само і $X^{2}$ .

Твердження (властивість екстремальності для $\operatorname {E} [X])$ ). Нехай $X$ є випадковою величиною, і $\operatorname {E} [X^{2}]<\infty$ . Тоді $\operatorname {E} [X]$ і $\operatorname {Var} [X]$ є скінченними, а $\operatorname {E} [X]$ найкраща апроксимація методом найменших квадратів для $X$ серед сталих. Зокрема,

для кожного $c\in \mathbb {R}$ , $\textstyle \operatorname {E} [X-c]^{2}\geq \operatorname {Var} [X];$
рівняння буде дійсним тоді і тільки тоді, коли $c=\operatorname {E} [X].$

( $\operatorname {Var} [X]$ позначає дисперсію величини $X$ ).

Пояснення (інтуїтивно зрозуміла інтерпретація властивості екстремальності). У простому розумінні, властивість екстремальності стверджує, що якщо існує задача передбачення результату^[en] випробування для випадкової величини $X$ , тоді $\operatorname {E} [X]$ , в деякому практичному сенсі, є найкращим закладом (передбачення) якщо немає попередньої інформації про результат. З іншого боку, якщо в результаті отриманого результату існує деяке уточнене знання ${\mathcal {F}}$ , тоді — знов, в деякому практичному сенсі — передбачення можна покращити використовуючи умовні математичні сподівання $\operatorname {E} [X\mid {\mathcal {F}}]$ (серед яких $\operatorname {E} [X]$ є особливим випадком) замість $\operatorname {E} [X]$ .

Доведення твердження. Відповідно до попередніх властивостей, $\operatorname {E} [X]$ і $\operatorname {Var} [X]=\operatorname {E} [X^{2}]-\operatorname {E} ^{2}[X]$ обидва є скінченними, і

{\begin{aligned}\operatorname {E} [X-c]^{2}&=\operatorname {E} [X^{2}-2cX+c^{2}]\\[6pt]&=\operatorname {E} [X^{2}]-2c\operatorname {E} [X]+c^{2}\\[6pt]&=(c-\operatorname {E} [X])^{2}+\operatorname {E} [X^{2}]-\operatorname {E} ^{2}[X]\\[6pt]&=(c-\operatorname {E} [X])^{2}+\operatorname {Var} [X],\end{aligned}}

звідки випливає властивість екстремальності.

Невиродженість[ред. | ред. код]

Якщо $\operatorname {E} |X|=0$ , тоді $X=0$ (майже певно).

Доведення.

Для будь-якої додатної сталої $r\in {\mathbb {R} }_{>0}$ , $\operatorname {P} (|X|\geq r)=0$ . Насправді,

r\cdot {\mathbf {1} }_{|X|\geq r}\leq |X|\cdot {\mathbf {1} }_{|X|\geq r}\leq |X|,

де ${\mathbf {1} }_{|X|\geq r}={\mathbf {1} }_{|X|\geq r}(\omega )$ це індикаторна функція для множини $\{\omega \in \Omega \mid |X(\omega )|\geq r\}$ . Відповідно до вищенаведеної властивості, скінченність $\operatorname {E} |X|$ гарантує, що математичні сподівання $\operatorname {E} [r\cdot {\mathbf {1} }_{|X|\geq r}]$ і $\operatorname {E} [|X|\cdot {\mathbf {1} }_{|X|\geq r}]$ також є скінченними. Відповідно до властивості монотонності,

r\cdot \operatorname {P} (|X|\geq r)=\operatorname {E} [r\cdot {\mathbf {1} }_{|X|\geq r}]\leq \operatorname {E} [|X|\cdot {\mathbf {1} }_{|X|\geq r}]\leq \operatorname {E} |X|=0.

Для деякого цілого числа $n>0$ , задамо $\textstyle r={\frac {1}{n}}$ . Визначимо $\textstyle S_{n}=\{\omega \in \Omega \mid |X(\omega )|\geq {\frac {1}{n}}\}$ , і

\textstyle S=\{\omega \in \Omega \mid |X(\omega )|>0\}.

Послідовність множин

S_{1}\subseteq \cdots \subseteq S_{n}\subseteq S_{n+1}\subseteq \cdots \subseteq S

монотонно не спадає, і $S=\cup _{n=1}^{\infty }S_{n}$ . Відповідно до «неперервності знизу», $\textstyle \operatorname {P} (S)=\lim _{n}\operatorname {P} (S_{n})$ . Застосувавши цю формулу, отримаємо

\operatorname {P} (X\neq 0)=\operatorname {P} (|X|>0)=\lim _{n}\operatorname {P} \left(|X|\geq {\frac {1}{n}}\right)=\lim _{n}0=0,

що і треба було довести.

Якщо $\operatorname {E} [X]<+\infty$ тоді $X<+\infty$ (майже певно)[ред. | ред. код]

Доведення.

Оскільки $\operatorname {E} [X]$ є визначеним (тобто $\min(\operatorname {E} [X_{+}],\operatorname {E} [X_{-}])<\infty$ ), і $\operatorname {E} [X]=\operatorname {E} [X_{+}]-\operatorname {E} [X_{-}],$ нам відомо, що $\operatorname {E} [X_{+}]$ є скінченним, і ми хочемо показати, що $X_{+}<+\infty$ (майже певно). Покажемо, що $\operatorname {P} (\Omega _{\infty })=0,$ де

\Omega _{\infty }=\{\omega \in \Omega \mid X_{+}(\omega )=+\infty \}.

Якщо $\Omega _{\infty }=\emptyset ,$ тоді $\operatorname {P} (\Omega _{\infty })=0,$ і доказ завершений. Припустивши, що $\Omega _{\infty }\neq \emptyset ,$ визначимо

\operatorname {SF} =\{s\mid s\ {\hbox{ є простою випадковою величиною}}\ 0\leq s\leq X_{+}\}.

Дано, що ${\rm {SF}}\neq \emptyset$ , оберемо $f\in {\rm {SF}}.$ Для кожного $\textstyle n>\sup _{\Omega }f,$ визначимо

f_{n}(\omega )={\begin{cases}n&{\hbox{if}}\ \omega \in \Omega _{\infty }\\[3pt]f(\omega )&{\hbox{if}}\ \omega \notin \Omega _{\infty }.\end{cases}}

Очевидно, $f_{n}\in {\rm {SF}},$ і

\operatorname {E} [f_{n}]=n\cdot \operatorname {P} (\Omega _{\infty })+h,

для деякої сталої $h\geq 0$ незалежної від $n.$ (Можна легко помітити, що, насправді, $h=\operatorname {E} [f\cdot {\mathbf {1} }_{\Omega \setminus \Omega _{\infty }}],$ , але в даному випадку це нас не цікавить).

Припустимо, що $\operatorname {P} (\Omega _{\infty })>0.$ Послідовність $\{\operatorname {E} [f_{n}]\}$ строго зростає, тому, за визначенням інтеграла Лебега,

\operatorname {E} [X_{+}]=\sup _{s\in {\rm {SF}}}\operatorname {E} [s]\geq \sup _{n>\sup _{\Omega }f}\operatorname {E} [f_{n}]=+\infty \cdot \operatorname {P} (\Omega _{\infty })+h=+\infty ,

що суперечить попередньому висновку, про те що $\operatorname {E} [X_{+}]$ є скінченним.

Наслідок: якщо $\operatorname {E} [X]>-\infty$ тоді $X>-\infty$ (майже певно)[ред. | ред. код]

Наслідок: якщо $\operatorname {E} |X|<\infty$ тоді $X\neq \pm \infty$ (майже певно)[ред. | ред. код]

$|\operatorname {E} [X]|\leq \operatorname {E} |X|$ [ред. | ред. код]

Для довільної випадкової величини буде вірною властивість $X$ , $|\operatorname {E} [X]|\leq \operatorname {E} |X|$ .

Доведення. Відповідно до визначення інтеграла Лебега,

{\begin{aligned}|\operatorname {E} [X]|&={\Bigl |}\operatorname {E} [X_{+}]-\operatorname {E} [X_{-}]{\Bigr |}\leq {\Bigl |}\operatorname {E} [X_{+}]{\Bigr |}+{\Bigl |}\operatorname {E} [X_{-}]{\Bigr |}\\[5pt]&=\operatorname {E} [X_{+}]+\operatorname {E} [X_{-}]=\operatorname {E} [X_{+}+X_{-}]\\[5pt]&=\operatorname {E} |X|.\end{aligned}}

Відмітимо, що цей самий результат можна довести за допомогою нерівності Єнсена.

Немультиплікативність[ред. | ред. код]

У загальному випадку, оператор математичного сподівання не є мультиплікативним, тобто $\operatorname {E} [XY]$ не обов'язково дорівнюватиме $\operatorname {E} [X]\cdot \operatorname {E} [Y]$ . Насправді, нехай $X$ приймає значення 1 та -1 із імовірністю 0.5 кожне. Тоді

\operatorname {E^{2}} [X]=\left({\frac {1}{2}}\cdot (-1)+{\frac {1}{2}}\cdot 1\right)^{2}=0,

і

\operatorname {E} [X^{2}]={\frac {1}{2}}\cdot (-1)^{2}+{\frac {1}{2}}\cdot 1^{2}=1,{\text{ тож }}\operatorname {E} [X^{2}]\neq \operatorname {E^{2}} [X].

Величина, на яку відрізняється мультиплікативність називається коваріацією:

\operatorname {Cov} (X,Y)=\operatorname {E} [XY]-\operatorname {E} [X]\operatorname {E} [Y].

Однак, якщо випадкові величини $X\in (\Omega _{1},{\mathcal {F}}_{1},\operatorname {P} _{1})$ і $Y\in (\Omega _{2},{\mathcal {F}}_{2},\operatorname {P} _{2})$ є незалежними, тоді $\operatorname {E} [XY]=\operatorname {E} [X]\operatorname {E} [Y]$ , та $\operatorname {Cov} (X,Y)=0$ .

Протилежний приклад: $\operatorname {E} [X_{i}]\not \to \operatorname {E} [X]$ незважаючи на це $X_{i}\to X$ поточково[ред. | ред. код]

Нехай $\left([0,1],{\mathcal {B}}_{[0,1]},{\mathrm {P} }\right)$ задає ймовірнісний простір, де ${\mathcal {B}}_{[0,1]}$ є Борелівською $\sigma$ -алгеброю над $[0,1]$ і ${\mathrm {P} }$ є лінійною мірою Лебега. Для $i\geq 1,$ визначимо послідовність випадкових величин

X_{i}=i\cdot {\mathbf {1} }_{\left[0,{\frac {1}{i}}\right]}

і випадкову величину

X={\begin{cases}+\infty &{\text{якщо}}\ x=0\\0&{\text{в інших випадках.}}\end{cases}}

в інтервалі $[0,1]$ , і де ${\mathbf {1} }_{S}$ є індикаторною функцією над множиною $S\subseteq [0,1]$ .

Для кожного $x\in [0,1],$ при тому як $i\to +\infty ,$ $X_{i}(x)\to X(x),$ і

\operatorname {E} [X_{i}]=i\cdot {\mathrm {P} }\left(\left[0,{\frac {1}{i}}\right]\right)=i\cdot {\dfrac {1}{i}}=1,

тож $\lim _{i\to \infty }\operatorname {E} [X_{i}]=1.$ З іншого боку, $\mathop {\mathrm {P} } (\{0\})=0,$ і таким чином $\operatorname {E} \left[X\right]=0.$

Зліченна неадитивність[ред. | ред. код]

У загальному випадку, оператор математичного сподівання не $\sigma$ -адитивний, тобто

\operatorname {E} \left[\sum _{i=0}^{\infty }X_{i}\right]\neq \sum _{i=0}^{\infty }\operatorname {E} [X_{i}].

Розглянемо обернений приклад, нехай $\left([0,1],{\mathcal {B}}_{[0,1]},{\mathrm {P} }\right)$ є ймовірнісним простором, де ${\mathcal {B}}_{[0,1]}$ це Борелівська $\sigma$ -алгебра у інтервалі $[0,1]$ і ${\mathrm {P} }$ це лінійна міра Лебега. Визначимо послідовність випадкових величин $\textstyle X_{i}=(i+1)\cdot {\mathbf {1} }_{\left[0,{\frac {1}{i+1}}\right]}-i\cdot {\mathbf {1} }_{\left[0,{\frac {1}{i}}\right]}$ у $[0,1]$ , де ${\mathbf {1} }_{S}$ задає індикаторну функцію над множиною $S\subseteq [0,1]$ . Для поточкових сум, матимемо що

\sum _{i=0}^{n}X_{i}=(n+1)\cdot {\mathbf {1} }_{\left[0,{\frac {1}{n+1}}\right]},

\sum _{i=0}^{\infty }X_{i}(x)={\begin{cases}+\infty &{\text{якщо}}\ x=0\\0&{\text{в інших випадках.}}\end{cases}}

Відповідно до скінченності адитивності,

\sum _{i=0}^{\infty }\operatorname {E} [X_{i}]=\lim _{n\to \infty }\sum _{i=0}^{n}\operatorname {E} [X_{i}]=\lim _{n\to \infty }\operatorname {E} \left[\sum _{i=0}^{n}X_{i}\right]=1.

З іншого боку, $\mathop {\mathrm {P} } (\{0\})=0,$ і тому

\operatorname {E} \left[\sum _{i=0}^{\infty }X_{i}\right]=0\neq 1=\sum _{i=0}^{\infty }\operatorname {E} [X_{i}].

Зліченна адитивність для не від'ємних випадкових величин[ред. | ред. код]

Нехай $\{X_{i}\}_{i=0}^{\infty }$ — невід'ємні випадкові величини. Із теореми про монотонну збіжність випливає, що

\operatorname {E} \left[\sum _{i=0}^{\infty }X_{i}\right]=\sum _{i=0}^{\infty }\operatorname {E} [X_{i}].

Нерівності[ред. | ред. код]

Нерівність Коші — Буняковського — Шварца[ред. | ред. код]

Докладніше: Нерівність Коші — Буняковського

Нерівність Коші — Буняковського стверджує, що

(\operatorname {E} [XY])^{2}\leq \operatorname {E} [X^{2}]\cdot \operatorname {E} [Y^{2}].

Нерівність Маркова[ред. | ред. код]

Докладніше: Нерівність Маркова

Для невід'ємної випадкової величини $X$ та $a>0$ , нерівність Маркова стверджує, що

\operatorname {P} (X\geq a)\leq {\frac {\operatorname {E} [X]}{a}}.

Нерівність Чебишова[ред. | ред. код]

Докладніше: Нерівність Чебишова

Нехай $X$ є довільною випадковою величиною із скінченним математичним сподіванням $\operatorname {E} [X]$ і скінченною дисперсією $\operatorname {Var} [X]\neq 0$ . Нерівність Чебишова стверджує що, для будь-якого дійсного числа $k>0$ ,

\operatorname {P} {\Bigl (}{\Bigl |}X-\operatorname {E} [X]{\Bigr |}\geq k{\sqrt {\operatorname {Var} [X]}}{\Bigr )}\leq {\frac {1}{k^{2}}}.

Нерівність Єнсена[ред. | ред. код]

Докладніше: Нерівність Єнсена

Нехай функція $f:{\mathbb {R} }\to {\mathbb {R} }$ є Борелівською опуклою функцією і $X$ — випадкова величина, для якої $\operatorname {E} |X|<\infty$ . Нерівність Єнсена стверджує, що

f(\operatorname {E} (X))\leq \operatorname {E} (f(X)).

Примітка 1. Математичне сподівання $\operatorname {E} (f(X))$ є добре визначеним навіть якщо $X$ може приймати нескінченні значення. Насправді, $\operatorname {E} |X|<\infty$ передбачає, що $X\neq \pm \infty$ (майже певно), тому випадкова величина $f(X(\omega ))$ майже певно є визначеною, і таким чином є достатньо інформації для розрахунку $\operatorname {E} (f(X))$ .

Примітка 2. Нерівність Єнсена передбачає, що $|\operatorname {E} [X]|\leq \operatorname {E} |X|$ оскільки, функція абсолютного значення є опуклою.

Нерівність Ляпунова[ред. | ред. код]

Нехай $0<s<t$ . Нерівність Ляпунова стверджує, що

{\Bigl (}\operatorname {E} |X|^{s}{\Bigr )}^{1/s}\leq \left(\operatorname {E} |X|^{t}\right)^{1/t}.

Доведення. Застосувавши Нерівність Єнсена до $|X|^{s}$ і $g(x)=|x|^{t/s}$ , отримаємо ${\Bigl |}\operatorname {E} |X^{s}|{\Bigr |}^{t/s}\leq \operatorname {E} |X^{s}|^{t/s}=\operatorname {E} |X|^{t}$ . Знайшовши $t$ -ий корінь для кожної сторони отримаємо те, що необхідно було довести.

Наслідок.

\operatorname {E} |X|\leq {\Bigl (}\operatorname {E} |X|^{2}{\Bigr )}^{1/2}\leq \cdots \leq {\Bigl (}\operatorname {E} |X|^{n}{\Bigr )}^{1/n}\leq \cdots

Нерівність Гельдера[ред. | ред. код]

Докладніше: Нерівність Гельдера

Нехай $p$ та $q$ задовольняють умовам $1\leq p\leq \infty$ , $1\leq q\leq \infty$ , і $1/p+1/q=1$ . Нерівність Гельдера стверджує, що

\operatorname {E} |XY|\leq (\operatorname {E} |X|^{p})^{1/p}(\operatorname {E} |Y|^{q})^{1/q}.

Нерівність Мінковського[ред. | ред. код]

Докладніше: Нерівність Мінковського

Нехай $p$ є цілим числом, що задовольняє умові $1\leq p\leq \infty$ . Крім того, нехай $\operatorname {E} |X|^{p}<\infty$ і $\operatorname {E} |Y|^{p}<\infty$ . тоді відповідно до нерівності Мінковського, $\operatorname {E} |X+Y|^{p}<\infty$ і

{\Bigl (}\operatorname {E} |X+Y|^{p}{\Bigr )}^{1/p}\leq {\Bigl (}\operatorname {E} |X|^{p}{\Bigr )}^{1/p}+{\Bigl (}\operatorname {E} |Y|^{p}{\Bigr )}^{1/p}.

Розрахунок границь під знаком оператора $\operatorname {E}$ [ред. | ред. код]

Теорема про монотонну збіжність[ред. | ред. код]

Докладніше: Теорема Леві про монотонну збіжність

Нехай послідовність випадкових величин $\{X_{n}\}$ і випадкових величин $X$ та $Y$ визначені у одному і тому ж ймовірносному просторі $(\Omega ,\Sigma ,\operatorname {P} ).$ Припустимо, що

всі математичні сподівання $\operatorname {E} [X_{n}],$ $\operatorname {E} [X],$ та $\operatorname {E} [Y]$ є визначеними (відрізняються від $\infty -\infty$ );
$\operatorname {E} [Y]>-\infty ;$
для кожного $n,$

-\infty \leq Y\leq X_{n}\leq X_{n+1}\leq +\infty \quad {\hbox{(a.s.)}};

$X$ це поточкова границя для $\{X_{n}\}$ (майже певно), тобто $X(\omega )=\lim \nolimits _{n}X_{n}(\omega )$ (майже певно).

Теорема про монотонну збіжність стверджує, що

$\lim _{n}\operatorname {E} [X_{n}]=\operatorname {E} [X].$

Доведення.

Відповідно до монотонності, помітимо що послідовність $\{\operatorname {E} [X_{n}]\}$ монотонно не спадає, і $\operatorname {E} [Y]\leq \operatorname {E} [X_{n}]\leq \operatorname {E} [X].$

Якщо $\operatorname {E} [Y]=+\infty ,$ тоді $\operatorname {E} [Y]=\operatorname {E} [X_{n}]=\operatorname {E} [X],$ що і треба було знайти.

Якщо $\operatorname {E} [Y]<+\infty ,$ тоді, із наступного припущення про те, що $\operatorname {E} [Y]>-\infty ,$ ми робимо висновок, що $\operatorname {E} [Y]$ є скінченним, що в свою чергу, передбачає, як ми перед цим бачили, що $Y$ є скінченною (майже певно).

Позначимо $Z_{n}=X_{n}-Y$ і $Z=X-Y$ . Скінченність $Y$ (майже певно) передбачає, що різниці $Z_{n}=X_{n}-Y$ та $Z=X-Y$ є визначеними (не мають форму $\infty -\infty$ ) усуди за межами нульової множини. В нульовій множині, $Z_{n}$ та $Z$ можна визначити довільним чином (тобто як нуль, або в будь-який інший спосіб допоки це зберігатиме вимірність), так що це не впливатиме на доведення. Оскільки вони є різницями випадкових величин, то $Z_{n}$ і $Z$ також є випадковими величинами.

Із визначення випливає, що $Z_{n}\geq 0$ (майже певно), $Z\geq 0$ (майже певно), послідовність $\{Z_{n}\}$ поточково не спадає (м.п.), і $Z_{n}\to Z$ поточково (м.п.).

Із (узагальненої версії) теореми про монотонну збіжність,

{\begin{aligned}(\lim _{n}\operatorname {E} [X_{n}])-\operatorname {E} [Y]&=\lim _{n}(\operatorname {E} [X_{n}]-\operatorname {E} [Y])\\&=\lim _{n}\operatorname {E} [X_{n}-Y]\\&=\lim _{n}\operatorname {E} [Z_{n}]\\&=\operatorname {E} [Z]\\&=\operatorname {E} [X-Y]\\&=\operatorname {E} [X]-\operatorname {E} [Y],\end{aligned}}

звідки випливає твердження.

Лема Фату[ред. | ред. код]

Докладніше: Лема Фату

Нехай послідовність випадкових величин $\{X_{n}\}$ і окрема випадкова величина $Y$ будуть визначені в єдиному ймовірнісному просторі $(\Omega ,\Sigma ,\operatorname {P} ).$ Припустимо, що

всі математичні сподівання $\operatorname {E} [X_{n}],$ $\textstyle \operatorname {E} [\liminf _{n}X_{n}],$ і $\operatorname {E} [Y]$ визначені (відрізняються від $\infty -\infty$ );
$\operatorname {E} [Y]>-\infty ;$
$-\infty \leq Y\leq X_{n}\leq +\infty$ (м.п.), для кожного $n.$

Лема Фату стверджує, що

\operatorname {E} [\liminf _{n}X_{n}]\leq \liminf _{n}\operatorname {E} [X_{n}].

(Зауважимо, що $\textstyle \liminf _{n}X_{n}$ є випадковою величиною, для кожного $n,$ відповідно до властивостей нижньої границі).

Доведення.

Якщо $\operatorname {E} [Y]=+\infty ,$ тоді відповідно до властивості монотонності, $\operatorname {E} [Y]=\operatorname {E} [X_{n}]=+\infty ,$ тож $\textstyle \liminf _{n}\operatorname {E} [X_{n}]=+\infty ,$ із наступним твердженням, що випливає із цього.

Якщо $\operatorname {E} [Y]<+\infty$ , тоді, відповідно до припущення про те, що $\operatorname {E} [Y]>-\infty ,$ ми робимо висновок, що $\operatorname {E} [Y]$ є скінченною, що в свою чергу зумовлює, як ми бачили перед тим, що $Y$ є скінченним (м.п.).

Позначимо $Z_{n}=X_{n}-Y$ . Тоді $Z_{n}\geq 0$ (м.п.). Скінченність величини $Y$ (м.п.) зумовлює, що $Z_{n}$ є визначеним (не приймає форму $\infty -\infty$ ) усюди за межами нульової множини. В цій нульовій множині $Z_{n}$ може визначатися довільним чином (наприклад, нулем або у будь-який інший спосіб, до тих пір доки зберігається вимірність) без впливу на доведення. Як різниця двох випадкових величин, $Z_{n}$ є також випадковою величиною.

Відповідно до узагальненої версії леми Фату,

{\begin{aligned}\operatorname {E} [\liminf _{n}X_{n}]-\operatorname {E} [Y]&=\operatorname {E} [\liminf _{n}(X_{n}-Y)]\\&=\operatorname {E} [\liminf _{n}Z_{n}]\\&\leq \liminf _{n}\operatorname {E} [Z_{n}]\\&=\liminf _{n}\operatorname {E} [X_{n}-Y]\\&=\liminf _{n}(\operatorname {E} [X_{n}]-\operatorname {E} [Y])\\&=(\liminf _{n}\operatorname {E} [X_{n}])-\operatorname {E} [Y],\end{aligned}}

звідки випливає твердження.

Наслідок. Нехай

$X_{n}\to X$ поточково (м.п.);
$\operatorname {E} [X_{n}]\leq C,$ для деякої сталої $C$ (незалежної від $n$ );
$\operatorname {E} [Y]>-\infty ;$
$-\infty \leq Y\leq X_{n}\leq +\infty$ (м.п.), для кожного $n.$

Тоді $\operatorname {E} [X]\leq C.$

Доведення виконують спостерігаючи за тим, що $\textstyle X=\liminf _{n}X_{n}$ (м.п.) і застосовуючи лему Фату.

Теорема про мажоровану збіжність[ред. | ред. код]

Докладніше: Теорема Лебега про мажоровану збіжність

Нехай $\{X_{n}\}_{n}$ є послідовністю випадкових величин. Якщо $X_{n}\to X$ поточково (м.п.), $|X_{n}|\leq Y\leq +\infty$ (м.п.), та $\operatorname {E} [Y]<\infty$ . Тоді, відповідно до теореми про мажоровану збіжність,

функція від $X$ є вимірною (hence a random variable);
$\operatorname {E} |X|<\infty$ ;
всі математичні сподівання $\operatorname {E} [X_{n}]$ та $\operatorname {E} [X]$ є визначеними (не приймають форму $\infty -\infty$ );
$\lim _{n}\operatorname {E} [X_{n}]=\operatorname {E} [X]$ (обидві сторони рівняння можуть бути скінченними);
$\lim _{n}\operatorname {E} |X_{n}-X|=0.$

Зв'язок із характеристичною функцією[ред. | ред. код]

Функція густини імовірностей $f_{X}$ для скалярної випадкової величини $X$ пов'язана із її характеристичною функцією $\varphi _{X}$ через формулу обернення:

f_{X}(x)={\frac {1}{2\pi }}\int _{\mathbb {R} }e^{-itx}\varphi _{X}(t)\,dt.

Для математичного сподівання величини $g(X)$ (де $g:{\mathbb {R} }\to {\mathbb {R} }$ є функцією Бореля), ми можемо використати формулу обернення аби отримати

\operatorname {E} [g(X)]={\frac {1}{2\pi }}\int _{\mathbb {R} }g(x)\left[\int _{\mathbb {R} }e^{-itx}\varphi _{X}(t)\,dt\right]\,dx.

Якщо $\operatorname {E} [g(X)]$ є скінченним, змінивши порядок інтегрування і відповідно до теореми Фубіні-Тонеллі, отримаємо

\operatorname {E} [g(X)]={\frac {1}{2\pi }}\int _{\mathbb {R} }G(t)\varphi _{X}(t)\,dt,

де

G(t)=\int _{\mathbb {R} }g(x)e^{-itx}\,dx

є перетворенням Фур'є для $g(x).$ Вираз для $\operatorname {E} [g(X)]$ випливає напряму із теореми Планшереля.

Приклад випадкової величини, що не має математичного сподівання[ред. | ред. код]

Нехай випадкова величина $\displaystyle \xi$ розподілена за законом Коші з параметрами $\displaystyle a$ та $\displaystyle b$ , тобто ${\mathcal {L}}(\xi )=K(a,b)$ . Ця випадкова величина має щільність:

p_{\xi }(x)={\frac {b}{\pi ((x-a)^{2}+b^{2})}}

.

Знайдемо її математичне сподівання.

\operatorname {E} (\xi )=\int _{\Omega }\xi dP=\int _{X}xp_{\xi }(x)dx=\int _{X}{\frac {bx}{\pi ((x-a)^{2}+b^{2})}}dx=

=b\int _{X}{\frac {x-a+a}{\pi ((x-a)^{2}+b^{2})}}dx={\frac {b}{2\pi }}\ln((x-a)^{2}+b^{2})+a\arctan {\frac {x-a}{b}}{\bigg |}_{x_{min}}^{x_{max}}

.

Наявність логарифма в останньому виразі робить неможливим обчислення цього інтегралу (внаслідок необмеженості логарифма при необмеженому аргументі), що і доводить відсутність математичного сподівання випадкової величини $\displaystyle \xi$ .

Застосування[ред. | ред. код]

Існує можливість побудувати таке математичне сподівання, яке буде дорівнювати імовірності події, якщо розраховувати його як математичне сподівання від індикаторної функції, яка приймає за одиницю факт виникнення події, і нуль у іншому випадку. Цей взаємозв'язок може використовуватися для застосування властивостей математичного сподівання і поширення їх до властивостей імовірностей, тобто, використовувати закон великих чисел, щоб обґрунтувати спосіб оцінки імовірностей за допомогою визначення частоти їх виникнення.

Математичні сподівання для різних степенів величини X називаються моментами величини X; центральний момент довкола середнього значення величини X це математичні сподівання степенів X − E[X]. Моменти деяких випадкових величин можуть використовуватися для визначення їх розподілів, через їх твірні функції моментів.

Для того, щоб імпіричним шляхом знайти оцінку математичного сподівання деякої випадкової величини, на основі неодноразово отриманих вимірах спостережень необхідно розрахувати середнє арифметичне значення для цих результатів. Якщо математичне сподівання існує, ця процедура дозволяє оцінити істинне математичне сподівання незміщеного виду і дозволяє мінімізувати суму квадратів залишків (суму квадратичних відстаней між спостереженнями і статистичними оцінками). Закон великих чисел демонструє (при досить м'яких умовах) що, із збільшенням розміру вибірки, дисперсія цієї статистичної оцінки зменшується.

Цю властивість використовують у дуже широкому колі різноманітних застосувань, включаючи загальні задачі теорії статистичного оцінювання та машинного навчання, що дозволяє оцінити (ймовірнісні) величини, що представляють інтерес, за допомогою методів Монте-Карло, оскільки більшість з цих величин можна представити у вигляді математичних сподівань, тобто $\operatorname {P} ({X\in {\mathcal {A}}})=\operatorname {E} [{\mathbf {1} }_{\mathcal {A}}]$ , де ${\mathbf {1} }_{\mathcal {A}}$ є характеристичною функцією для множини ${\mathcal {A}}$ .

В класичній механіці, the центр мас є поняттям, яке аналогічне математичному сподіванню. Наприклад, припустимо, що X це дискретна випадкова величина, що приймає значення x_i і має відповідні імовірності p_i. Розглянемо невагомий стрижень, на якому здовж цього стрижня розміщені елементи ваги, в місцях розташування x_i, які мають маси p_i (сума яких дорівнює одиниці). Точка, в якій цей стрижень буде збалансований буде відповідати E[X].

Математичні сподівання також можна використовувати для розрахунку дисперсії, за допомогою формули розрахунку дисперсії:

\operatorname {Var} (X)=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.

Дуже важливою областю застосування математичного сподівання є квантова механіка. Математичне сподівання для оператора квантової механіки ${\hat {A}}$ , що виконує операцію над вектором $|\psi \rangle$ квантового стану записується як $\langle {\hat {A}}\rangle =\langle \psi |A|\psi \rangle$ . Невизначеність для ${\hat {A}}$ можна розрахувати за допомогою формули $(\Delta A)^{2}=\langle {\hat {A}}^{2}\rangle -\langle {\hat {A}}\rangle ^{2}$ .

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]

Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
Гнеденко Б. В. Курс теории вероятностей. — 6-е изд. — Москва : Наука, 1988. — 446 с.(рос.)
Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)

Примітки[ред. | ред. код]

↑ Швець, В. Т. (2018). Теорія ймовірностей і математична статистика (PDF). Одеса: ВМВ. Архів оригіналу (PDF) за 2 квітня 2019. Процитовано 2 квітня 2019.
↑ Сеньо П. С. Теорія ймовірностей та математична статистика: Підручник. — 2-ге вид., перероб. і доп. — К.: Знання, 2007. — 556 с. — ISBN 966-346-284-1.
↑ Sheldon M Ross (2007). §2.4 Expectation of a random variable. Introduction to probability models (вид. 9th). Academic Press. с. 38 ff. ISBN 0-12-598062-0. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.
↑ Richard W Hamming (1991). §2.5 Random variables, mean and the expected value. The art of probability for scientists and engineers. Addison–Wesley. с. 64 ff. ISBN 0-201-40686-1. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.
↑ Richard W Hamming (1991). Example 8.7–1 The Cauchy distribution. The art of probability for scientists and engineers. Addison-Wesley. с. 290 ff. ISBN 0-201-40686-1. Архів оригіналу за 22 березня 2015. Процитовано 17 березня 2019. Sampling from the Cauchy distribution and averaging gets you nowhere — one sample has the same distribution as the average of 1000 samples!
↑ Чебышев П. Л. Полное собрание сочинений. — Математический анализ. — М.- Л., 1947. — С. 431.

[1] Швець, В. Т. (2018). Теорія ймовірностей і математична статистика (PDF). Одеса: ВМВ. Архів оригіналу (PDF) за 2 квітня 2019. Процитовано 2 квітня 2019.

[2] Сеньо П. С. Теорія ймовірностей та математична статистика: Підручник. — 2-ге вид., перероб. і доп. — К.: Знання, 2007. — 556 с. — ISBN 966-346-284-1.

[Ross-3] Sheldon M Ross (2007). §2.4 Expectation of a random variable. Introduction to probability models (вид. 9th). Academic Press. с. 38 ff. ISBN 0-12-598062-0. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.

[Hamming-4] Richard W Hamming (1991). §2.5 Random variables, mean and the expected value. The art of probability for scientists and engineers. Addison–Wesley. с. 64 ff. ISBN 0-201-40686-1. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.

[Hamming2-5] Richard W Hamming (1991). Example 8.7–1 The Cauchy distribution. The art of probability for scientists and engineers. Addison-Wesley. с. 290 ff. ISBN 0-201-40686-1. Архів оригіналу за 22 березня 2015. Процитовано 17 березня 2019. Sampling from the Cauchy distribution and averaging gets you nowhere — one sample has the same distribution as the average of 1000 samples!

[6] Чебышев П. Л. Полное собрание сочинений. — Математический анализ. — М.- Л., 1947. — С. 431.

[1]

[2]

[3]

[4]

[5]

[6]

Математичне сподівання

Означення 1[ред. | ред. код]

Приклади[ред. | ред. код]

Означення 2[ред. | ред. код]

Деякі формули для обчислення математичного сподівання[ред. | ред. код]

Основні властивості математичного сподівання[ред. | ред. код]

E ⁡ [ 1 A ] = P ⁡ ( A ) {\displaystyle \operatorname {E} [{\mathbf {1} }_{A}]=\operatorname {P} (A)} [ред. | ред. код]

Якщо X = Y тоді E[X] = E[Y][ред. | ред. код]

Математичне сподівання для сталої[ред. | ред. код]

Лінійність[ред. | ред. код]

E[X] існує і є скінченним тоді і тільки тоді, коли E[|X|] є скінченним[ред. | ред. код]

Якщо X ≥ 0 тоді E[X] ≥ 0[ред. | ред. код]

Монотонність[ред. | ред. код]

Якщо | X | ≤ Y {\displaystyle |X|\leq Y} (майже скрізь) і E ⁡ [ Y ] {\displaystyle \operatorname {E} [Y]} є скінченною, тоді так само і для E ⁡ [ X ] {\displaystyle \operatorname {E} [X]} [ред. | ред. код]

Якщо E ⁡ | X β | < ∞ {\displaystyle \operatorname {E} |X^{\beta }|<\infty } та 0 < α < β {\displaystyle 0<\alpha <\beta } тоді E ⁡ | X α | < ∞ {\displaystyle \operatorname {E} |X^{\alpha }|<\infty } [ред. | ред. код]

Протилежний приклад для нескінченної міри[ред. | ред. код]

Властивість екстремальності[ред. | ред. код]

Невиродженість[ред. | ред. код]

Якщо E ⁡ [ X ] < + ∞ {\displaystyle \operatorname {E} [X]<+\infty } тоді X < + ∞ {\displaystyle X<+\infty } (майже певно)[ред. | ред. код]

Наслідок: якщо E ⁡ [ X ] > − ∞ {\displaystyle \operatorname {E} [X]>-\infty } тоді X > − ∞ {\displaystyle X>-\infty } (майже певно)[ред. | ред. код]

Наслідок: якщо E ⁡ | X | < ∞ {\displaystyle \operatorname {E} |X|<\infty } тоді X ≠ ± ∞ {\displaystyle X\neq \pm \infty } (майже певно)[ред. | ред. код]

| E ⁡ [ X ] | ≤ E ⁡ | X | {\displaystyle |\operatorname {E} [X]|\leq \operatorname {E} |X|} [ред. | ред. код]

Немультиплікативність[ред. | ред. код]

Протилежний приклад: E ⁡ [ X i ] ↛ E ⁡ [ X ] {\displaystyle \operatorname {E} [X_{i}]\not \to \operatorname {E} [X]} незважаючи на це X i → X {\displaystyle X_{i}\to X} поточково[ред. | ред. код]

Зліченна неадитивність[ред. | ред. код]

Зліченна адитивність для не від'ємних випадкових величин[ред. | ред. код]

Нерівності[ред. | ред. код]

Нерівність Коші — Буняковського — Шварца[ред. | ред. код]

Нерівність Маркова[ред. | ред. код]

Нерівність Чебишова[ред. | ред. код]

Нерівність Єнсена[ред. | ред. код]

Нерівність Ляпунова[ред. | ред. код]

Нерівність Гельдера[ред. | ред. код]

Нерівність Мінковського[ред. | ред. код]

Розрахунок границь під знаком оператора E {\displaystyle \operatorname {E} } [ред. | ред. код]

Теорема про монотонну збіжність[ред. | ред. код]

Лема Фату[ред. | ред. код]

Теорема про мажоровану збіжність[ред. | ред. код]

Зв'язок із характеристичною функцією[ред. | ред. код]

Приклад випадкової величини, що не має математичного сподівання[ред. | ред. код]

Застосування[ред. | ред. код]

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]

Примітки[ред. | ред. код]

Навігаційне меню

Пошук

$\operatorname {E} [{\mathbf {1} }_{A}]=\operatorname {P} (A)$ [ред. | ред. код]

Якщо $|X|\leq Y$ (майже скрізь) і $\operatorname {E} [Y]$ є скінченною, тоді так само і для $\operatorname {E} [X]$ [ред. | ред. код]

Якщо $\operatorname {E} |X^{\beta }|<\infty$ та $0<\alpha <\beta$ тоді $\operatorname {E} |X^{\alpha }|<\infty$ [ред. | ред. код]

Якщо $\operatorname {E} [X]<+\infty$ тоді $X<+\infty$ (майже певно)[ред. | ред. код]

Наслідок: якщо $\operatorname {E} [X]>-\infty$ тоді $X>-\infty$ (майже певно)[ред. | ред. код]

Наслідок: якщо $\operatorname {E} |X|<\infty$ тоді $X\neq \pm \infty$ (майже певно)[ред. | ред. код]

$|\operatorname {E} [X]|\leq \operatorname {E} |X|$ [ред. | ред. код]

Протилежний приклад: $\operatorname {E} [X_{i}]\not \to \operatorname {E} [X]$ незважаючи на це $X_{i}\to X$ поточково[ред. | ред. код]

Розрахунок границь під знаком оператора $\operatorname {E}$ [ред. | ред. код]