Метод максимальної вірогідності
Метод максимальної вірогідності (також метод найбільшої вірогідності) у математичній статистиці — це метод оцінювання невідомого параметра шляхом максимізації функції вірогідності. Заснований на припущенні про те, що вся інформація про статистичну вибірку міститься у функції вірогідності. Метод максимальної вірогідності був проаналізований, рекомендований і значно популяризуваний Р. Фішером між 1912 і 1922 роками (хоча раніше він використовувався Гаусом, Лапласом і іншими). Оцінка максимальної вірогідності є популярним статистичним методом, який використовується для створення статистичної моделі на основі даних, і забезпечення оцінки параметрів моделі.
Метод максимальної вірогідності відповідає багатьом відомим методам оцінки в області статистики. Наприклад, припустимо, що ви зацікавлені зростом мешканців України. Припустимо, у вас дані стосовно росту деякої кількості людей, а не всього населення. Крім того передбачається, що зріст є нормально розподіленою величиною з невідомою дисперсією і середнім значенням. Вибіркові середнє значення і дисперсія зросту є максимально правдоподібними до середнього значення і дисперсії всього населення.
Для фіксованого набору даних і базової вірогідної моделі, використовуючи метод максимальної вірогідності, ми набудемо значень параметрів моделі, які роблять дані «ближчими» до реальних. Оцінка максимальної вірогідності дає унікальний і простий спосіб визначити рішення у разі нормального розподілу.
Зміст |
Застосування [ред.]
Метод оцінки максимальної вірогідності застосовується для широкого кола статистичних моделей, зокрема:
-
- лінійні моделі і узагальнені лінійні моделі;
- факторний аналіз;
- моделювання структурних рівнянь;
- багато ситуацій, в рамках перевірки гіпотези і довірчого інтервалу формування;
- дискретні моделі вибору.
Метод застосовується в широких областях науки, зокрема:
-
- системи зв'язку;
- психометрія;
- економетрика;
- час затримки в акустичних і електромагнітних системах;
- моделювання в ядерній фізиці і фізиці елементарних частинок;
- обчислювальна філогенетика;
- моделювання каналів в транспортних мережах.
Визначення [ред.]
Нехай маємо вибірку
з розподілу
, де
— невідомий параметр. Нехай
— функція вірогідності, де
. Точкова оцінка
називається оцінкою максимальної вірогідності параметра
. Таким чином, оцінка максимальної вірогідності — це така оцінка, яка максимізує функцію вірогідності при фіксованій реалізації вибірки.
Зауваження [ред.]
- Оскільки функція
монотонно зростає на всій області визначення, максимум будь-якої функції
є максимумом функції
, і навпаки. Таким чином,
,
де
— логарифмічна функція вірогідності.
- Оцінка максимальної вірогідності, взагалі кажучи, може бути зміщеною(див. приклади).
Приклади [ред.]
- Нехай
— незалежна вибірка з неперервного рівномірного розподілу на відрізку
, де
— невідомий параметр. Тоді функція вірогідності має вигляд
Остання рівність може бути переписана у вигляді:
де
, звідки видно, що свого максимуму функція вірогідності досягає в точці
. Таким чином
.
- Нехай
— незалежна вибірка з нормального розподілу з відомим середнім і дисперсією. Побудуємо оцінку максимальної вірогідності
для невідомого вектора параметрів
. Логарифмічна функція вірогідності приймає вигляд
.
Щоб знайти її максимум, прирівнюємо до нуля часткові похідні:
звідки
— вибіркове середнє, а
— вибіркова дисперсія.
| Ця стаття не містить посилань на джерела. (жовтень 2010) |


монотонно зростає на всій області визначення, максимум будь-якої функції
є максимумом функції
, і навпаки. Таким чином,
,
— незалежна
, де
— невідомий параметр. Тоді функція вірогідності має вигляд![f(\mathbf{x} \mid \theta ) =
\left\{
\begin{array}{ll}
\frac{1}{\theta^n}, & \mathbf{x} \in [0,\theta]^n \subset \mathbb{R}^n \\
0, & \mathbf{x} \not\in [0,\theta]^n
\end{array}
\right..](http://upload.wikimedia.org/math/8/1/4/81464077e60b78f01e9055f04504403e.png)

.
— незалежна вибірка з
для невідомого вектора параметрів
. Логарифмічна функція вірогідності приймає вигляд
.![\left\{
\begin{matrix}
\displaystyle \frac{\partial}{\partial \mu} L(\mathbf{x} \mid \mu, \sigma^2 ) = 0 \\[10pt]
\displaystyle \frac{\partial}{\partial \sigma^2} L(\mathbf{x} \mid \mu, \sigma^2 ) = 0 \\
\end{matrix}
\right. \Rightarrow
\left\{
\begin{matrix}
\displaystyle \frac{ \sum\limits_{i=1}^n X_i - n \mu}{\sigma^2} = 0 \\[10pt]
\displaystyle -\frac{n}{2 \sigma^2} +\frac{\sum\limits_{i=1}^n (X_i - \mu)^2}{2 \left(\sigma^2\right)^2} = 0 \\
\end{matrix}
\right.,](http://upload.wikimedia.org/math/0/b/f/0bfa0ebb3c27128d3893d428ff8851af.png)
—
—