Дискретний рівномірний розподіл |
---|
![](//upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Uniform_discrete_pmf_svg.svg/325px-Uniform_discrete_pmf_svg.svg.png) Масова функція розподілу імовірностей для рівномірного розподілу із параметром n = 5 n = 5 де n = b − a + 1 |
Функція розподілу ймовірностей ![](//upload.wikimedia.org/wikipedia/commons/thumb/7/77/Dis_Uniform_distribution_CDF.svg/325px-Dis_Uniform_distribution_CDF.svg.png) Кумулятивна функція дискретного рівномірного розподілу для n = 5 |
Параметри | ![{\displaystyle a\in \{\dots ,-2,-1,0,1,2,\dots \}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7d0ef6d48669c6fe52d9bc4bb3fca0d470737c0a)
![{\displaystyle b\in \{\dots ,-2,-1,0,1,2,\dots \},b\geq a}](https://wikimedia.org/api/rest_v1/media/math/render/svg/93bd5093b8447b1193b060464fd84d75b2658dde)
![{\displaystyle n=b-a+1\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/37f7c435cbb8585d7847d0f70a6762f59811cb3f) |
---|
Носій функції | ![{\displaystyle k\in \{a,a+1,\dots ,b-1,b\}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/76e6dd4b2fd1f63b385ed4b2cf6646c7c70ba894) |
---|
Розподіл імовірностей | ![{\displaystyle {\frac {1}{n}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cf0aefecf48d43fdedd71e318ae6129bd67be252) |
---|
Функція розподілу ймовірностей (cdf) | ![{\displaystyle {\frac {\lfloor k\rfloor -a+1}{n}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8c06a0d28e1f4d41d276debb1bd2a986d591c1cd) |
---|
Середнє | ![{\displaystyle {\frac {a+b}{2}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/624d7fda7043e152affce9651f48c57b5b7d312a) |
---|
Медіана | ![{\displaystyle {\frac {a+b}{2}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/624d7fda7043e152affce9651f48c57b5b7d312a) |
---|
Мода | N/A |
---|
Дисперсія | ![{\displaystyle {\frac {(b-a+1)^{2}-1}{12}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2b12b4afa165ed4061d83380e22605722375ffba) |
---|
Коефіцієнт асиметрії | ![{\displaystyle 0\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db4b06f9315849466a0502680377e30a9da8a1b5) |
---|
Коефіцієнт ексцесу | ![{\displaystyle -{\frac {6(n^{2}+1)}{5(n^{2}-1)}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59d98fa702583a36ae69e3e46e9e22c7d684f2f0) |
---|
Ентропія | ![{\displaystyle \ln(n)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/088a1e7ec29ce858570f7df4fab6b66c30ff25a5) |
---|
Твірна функція моментів (mgf) | ![{\displaystyle {\frac {e^{at}-e^{(b+1)t}}{n(1-e^{t})}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7178154884e03f88b2d4255bb883fcdca1350416) |
---|
Характеристична функція | ![{\displaystyle {\frac {e^{iat}-e^{i(b+1)t}}{n(1-e^{it})}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1625d0b149209606433e62bb872630346486e68d) |
---|
В теорії ймовірностей і статистиці випадкова величина має дискретний рівномірний розподіл, якщо вона приймає скінченне число значень з однаковими ймовірностями.
Якщо випадкова величина може приймати будь-яке з n значень k1,k2,…,kn, тоді це є дискретним рівномірним розподілом. Ймовірність випадання kj дорівнює 1/n. Простим прикладом дискретного рівномірного розподілу є випадання гральної кості. k набуває значень 1, 2, 3, 4, 5, 6 і кожен раз
випадає з імовірністю 1/6. У випадку, коли випадкова величина є дійсним числом, то функцію розподілу можна виразити у термінах виродженого розподілу таким чином:
Вибірка із k спостережень отримана із рівномірного розподілу цілих чисел
, для якої існує задача оцінити невідомий максимум N. Цю задачу іноді називають задачею про німецький танк[en], після того як цей метод оцінки максимуму було застосовано для оцінки темпів виробництва німецьких танків під час Другої світової війни.
Незміщена оцінка з мінімальною дисперсією для рівномірного розподілу, яка визначає максимум задається наступним чином
![{\displaystyle {\hat {N}}={\frac {k+1}{k}}m-1=m+{\frac {m}{k}}-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d34d9e3acf60c76262a1edfddff7ef3700af577)
де m є вибірковим максимумом, а k - розмір вибірки, для вибірки без повторного заміщення.[1] Цей приклад можна розглядати як спрощений випадок оцінки максимального інтервалу[en].
При цьому матимемо дисперсію[1]
![{\displaystyle {\frac {1}{k}}{\frac {(N-k)(N+1)}{(k+2)}}\approx {\frac {N^{2}}{k^{2}}}{\text{ для малих вибірок }}k\ll N}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6d7533c1603b351638109575bc2b37229066e9c5)
тож стандартне відхилення приблизно становить
, середній розмір (для сукупності) проміжку між елементами; порівняємо із вищевказаним
.
Максимум вибірки є оцінкою максимальної правдоподібності для максимуму сукупності, але, як зазначалося вище, він є зміщеним.
Якщо вибірка не представлена числами, але її можна промаркувати або розрізнити, розмір популяції можливо визначити методом "Зловити/повторити".
Для будь-якого цілого числа m такого що k ≤ m ≤ N, імовірність того, що вибірковий максимум буде дорівнювати m можна розрахувати наступним чином. Кількість різних груп із k танків, які можуть бути утворені із загальної кількості з N танків визначається через біноміальний коефіцієнт
. Оскільки при такому способі підрахунку, перестановки танків розраховуються лише раз, ми можемо впорядкувати серійні номери і відмітити максимальний з них в кожній вибірці. Аби розрахувати імовірність ми повинні полічити кількість впорядкованих вибірок, які можуть містити останній елемент, який буде дорівнювати m а всі інші k-1 танків мають номери менші або такий що дорівнює m-1. Кількість таких вибірок з k-1 танків які можна отримати із загальної кількості m-1 танків задається біноміальним коефіцієнтом
, тож імовірність отримати максимум m становить
.
Дано загальну кількість N і розмір вибірки k, математичне сподівання максимуму вибірки визначається як:
![{\displaystyle {\begin{aligned}\mu =\mathrm {E} [m]&=\sum _{m=k}^{N}m{\frac {\tbinom {m-1}{k-1}}{\tbinom {N}{k}}}\\&={\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\frac {m!}{(m-k)!}}\\&={\frac {k!}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\tbinom {m}{k}}\\&=k{\frac {\tbinom {N+1}{k+1}}{\tbinom {N}{k}}}\\&={\frac {k(N+1)}{k+1}},\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/23170ba302df742e8614d7cf4399c48636828c06)
де було використано рівняння із трикутником Паскаля[en]
.
Із цього рівняння, невідому кількість N можна розрахувати через сподівання і розмір вибірки, наступним чином
![{\displaystyle {\begin{aligned}N&=\mu \left(1+k^{-1}\right)-1.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7c97fcb3f2c349ffe7a2a12aa7e4da5a54631017)
Відповідно до лінійності математичного сподівання, отримаємо
![{\displaystyle {\begin{aligned}\mu \left(1+k^{-1}\right)-1&=\mathrm {E} \left[m\left(1+k^{-1}\right)-1\right],\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f6726c1a12f893fd011a31b3f4ef85ed8fde67da)
і таким чином незміщена оцінка для N отримується за допомогою заміни сподівання на спостереження,
![{\displaystyle {\begin{aligned}{\hat {N}}&=m\left(1+k^{-1}\right)-1.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f0ba36ac6f9dcabee33a00ce31885cc32fce99db)
Крім того, що ця оцінка є незміщеною вона також досягає мінімальної дисперсії. Аби показати це, відмітимо спершу, що максимум вибірки є достатньою статистикою для визначення максимуму сукупності, оскільки імовірність P(m;N) задається як функція лише від однієї m. Далі необхідно довести, що статистика m також є повною статистикою[en], особливим видом достатньої статистики (demonstration pending). Тоді Теорема Лемана-Шеффе[en] передбачає, що
є незміщеною оцінкою для N із найменшою дисперсією.[2]
Дисперсія оцінки розраховується як дисперсія вибіркового максимуму
![{\displaystyle {\begin{aligned}\mathrm {Var} [{\hat {N}}]&={\frac {(k+1)^{2}}{k^{2}}}\mathrm {Var} [m].\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4d8fa69e9a1c6a8afb1ed7eed054d6711657a8ea)
Дисперсія максимуму в свою чергу розраховується із математичних сподівань
і
. Розрахунок математичного сподівання для
є наступним,
![{\displaystyle {\begin{aligned}\mathrm {E} [m^{2}]&=\sum _{m=k}^{N}m^{2}{\frac {\tbinom {m-1}{k-1}}{\tbinom {N}{k}}}\\&={\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}m{\frac {m!}{(m-k)!}}\\&={\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}(m+1-1){\frac {m!}{(m-k)!}}\\&={\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\frac {(m+1)!}{(m-k)!}}-{\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\frac {m!}{(m-k)!}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/badb7b87eae8e7ab0aba1a5e655e967caaab25bf)
де другий терм є математичним сподіванням для
. Перший терм можна виразити через k і N,
![{\displaystyle {\begin{aligned}{\frac {1}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\frac {(m+1)!}{(m-k)!}}&={\frac {(k+1)!}{(k-1)!{\tbinom {N}{k}}}}\sum _{m=k}^{N}{\tbinom {m+1}{k+1}}\\&={\frac {k(k+1)}{\tbinom {N}{k}}}\sum _{n=k+1}^{N+1}{\tbinom {n}{k+1}}\\&={\frac {k(k+1)}{\tbinom {N}{k}}}{\tbinom {N+2}{k+2}}\\&={\frac {k(N+2)(N+1)}{(k+2)}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3797c1c7a311b3a63bc919f746cbc033bffba736)
де була використана заміна
і використане рівняння із трикутником Паскаля[en]. Підставлення цього результату і математичного сподівання
в рівняння для
дає
![{\displaystyle {\begin{aligned}\mathrm {E} [m^{2}]&={\frac {k(N+2)(N+1)}{(k+2)}}-{\frac {k(N+1)}{k+1}}\\&=k(N+1){\Big (}{\frac {N+2}{k+2}}-{\frac {1}{k+1}}{\Big )}\\&={\frac {k(N+1)(kN+k+N)}{(k+1)(k+2)}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/236f18aacd1f9000a132377bfc24ab34a6ee9c5b)
Тоді можна отримати дисперсію для
,
![{\displaystyle {\begin{aligned}\mathrm {Var} [m]&=\mathrm {E} [m^{2}]-\mathrm {E} [m]^{2}\\&={\frac {k(N+1)}{(k+1)}}{\Big (}{\frac {kN+k+N}{k+2}}-{\frac {k(N+1)}{k+1}}{\Big )}\\&={\frac {k(N+1)}{(k+1)}}{\frac {(N-k)}{(k+2)(k+1)}}\\&={\frac {k(N+1)(N-k)}{(k+1)^{2}(k+2)}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c6db7102699fb7a2357727ad9b1cdb44f3c4d2a8)
Зрештою можна розрахувати дисперсію для оцінки
,
![{\displaystyle {\begin{aligned}\mathrm {Var} [{\hat {N}}]&={\frac {(k+1)^{2}}{k^{2}}}\mathrm {Var} [m]\\&={\frac {(k+1)^{2}}{k^{2}}}{\frac {k(N+1)(N-k)}{(k+1)^{2}(k+2)}}\\&={\frac {(N+1)(N-k)}{k(k+2)}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d27de49b7ad0676141e8d5d2300850e434053419)
- ↑ а б Johnson, Roger (1994), Estimating the Size of a Population, Teaching Statistics, 16 (2 (Summer)), doi:10.1111/j.1467-9639.1994.tb00688.x, архів оригіналу за 26 травня 2009, процитовано 18 березня 2019
- ↑ G. A. Young and R. L Smith (2005) Essentials of Statistical Inference, Cambridge University Press, Cambridge, UK, p. 95
|
---|
| | | Дискретні одновимірні зі скінченним носієм |
|
---|
| Дискретні одновимірні з нескінченним носієм |
|
---|
| Неперервні одновимірні з носієм на обмеженому проміжку |
|
---|
| Неперервні одновимірні з носієм на напів-нескінченному проміжку |
|
---|
| Неперервні одновимірні з носієм на всій дійсній прямій |
|
---|
| Неперервні одновимірні з носієм змінного типу |
|
---|
| Змішані неперервно-дискретні одновимірні |
|
---|
| Багатовимірні (спільні) |
|
---|
| Напрямкові |
|
---|
| Вироджені та сингулярні[en] |
|
---|
| Сімейства |
|
---|
|