Функція внеску
У статистиці вне́сок, фу́нкція вне́ску, або ефекти́вний вне́сок (англ. score, score function, efficient score,[1] informant[2]) показує, наскільки чутливо функція правдоподібності залежить від свого параметру[en] . В явному вигляді внесок є градієнтом логарифмічної правдоподібності по відношенню до .
Внесок відіграє важливу роль у деяких аспектах висновування. Наприклад:
- у формулюванні локально найпотужнішого статистичного критерію;[3]
- у наближенні похибки в оцінці максимальної правдоподібності;[4]
- у показуванні асимптотичної достатності оцінки максимальної правдоподібності;[4]
- у формулюванні довірчих інтервалів;[5]
- у показуваннях нерівності Крамера — Рао.[6]
Функція внеску також відіграє важливу роль в обчислювальній статистиці[en], оскільки вона може грати певну роль в обчисленні оцінок максимальної правдоподібності.
Функція внеску, або ефективний внесок,[1] — це градієнт (вектор часткових похідних) по відношенню до деякого параметру логарифму (зазвичай, натурального логарифму) функції правдоподібності (логарифмічної правдоподібності). Якщо спостереженням є , а його правдоподібністю є , то внесок може бути знайдено за допомогою ланцюгового правила:
Таким чином, внесок показує чутливість (її похідну, нормалізовану за її значенням). Зауважте, що є функцією від та спостереження , отже, взагалі кажучи, він не є статистикою. Проте в деяких застосуваннях, таких як перевірка внеску[en], внесок оцінюється на певному значення (такому як значення нульової гіпотези, або оцінка максимальної правдоподібності ), і в такому випадку результатом є статистика.
У старій літературі для позначення внеску по відношенню до нескінченно малого перенесення заданої густини може застосовуватися термін «лінійний внесок» (англ. linear score). Цей звичай походить з того часу, коли основним параметром, що становив інтерес, було середнє значення або медіана розподілу. В цьому випадку правдоподібність спостереження задається густиною вигляду . Тоді «лінійний внесок» визначається як
За деяких умов закономірності[en], математичне сподівання по відношенню до спостереження за умови істинності параметру , що записується як , є нульовим. Щоби побачити це, перепишімо функцію правдоподібності L як функцію густини ймовірності . Тоді
Якщо дотримуються певні умови диференційовності (див. Формула Лейбніца), то цей інтеграл може бути переписано як
Варто перевикласти отриманий вище результат словами: математичне сподівання внеску є нульовим. Таким чином, якщо потрібно було повторювано брати проби з деякого розподілу, і повторювано обчислювати внесок, то при наближенні числа повторюваних проб до нескінченності середнє значення цих внесків прямуватиме до нуля.
Дисперсія внеску відома як інформація за Фішером, і записується як . Оскільки математичне сподівання внеску є нульовим, її може бути записано як
Зауважте, що визначена таким чином інформація за Фішером не є функцією будь-якого конкретного спостереження, оскільки випадкову змінну було усереднено. Це поняття інформації є корисним при порівнянні двох методів спостереження деякого випадкового процесу.
Розгляньмо процес Бернуллі[en] з A успіхами та B невдачами; ймовірністю успіху є θ.
Тоді правдоподібністю L є
таким чином, внеском V є
Тепер ми можемо перевірити, що математичне сподівання внеску є нульовим. Зауважуючи, що математичним сподіванням A є nθ, а математичним сподіванням B є n(1 − θ) [пригадаймо, що A та B є випадковими змінними], ми можемо побачити, що математичним сподіванням V є
Ми можемо також перевірити й дисперсію . Нам відомо, що A + B = n (таким чином, B = n − A), і що дисперсією A є nθ(1 − θ), таким чином, дисперсією V є
Для моделей з двійковими виходами (Y = 1 або 0) внесок моделі може оцінюватися за допомогою логарифму передбачень
де p є ймовірністю в оцінюваній моделі, а S є внеском.[7]
Детальніші відомості з цієї теми ви можете знайти в статті Внесковий алгоритм[en].
Внесковий алгоритм (англ. scoring algorithm) — це ітеративний метод чисельного визначення статистичної оцінки максимальної правдоподібності.
Детальніші відомості з цієї теми ви можете знайти в статті Перевірка внеску[en].
Цей розділ потребує доповнення. (травень 2016) |
- Інформація за Фішером
- Теорія інформації
- Перевірка внеску[en]
- Внесковий алгоритм[en]
- Крива підтримки[en]
- ↑ а б Cox та Hinkley, 1974, с. 107.
- ↑ Chentsov, 2001.
- ↑ Cox та Hinkley, 1974, с. 113.
- ↑ а б Cox та Hinkley, 1974, с. 295.
- ↑ Cox та Hinkley, 1974, с. 222–3.
- ↑ Cox та Hinkley, 1974, с. 254.
- ↑ Steyerberg та ін., 2010.
- Cox, D. R.; Hinkley, D. V. (1974). Theoretical Statistics. Chapman & Hall. ISBN 0-412-12420-3. (англ.)
- Schervish, Mark J. (1995). Theory of Statistics. New York: Springer. Section 2.3.1. ISBN 0-387-94546-6. (англ.)
- Chentsov, N.N. (2001), Informant, у Hazewinkel, Michiel (ред.), Математична енциклопедія, Springer, ISBN 978-1-55608-010-4 (англ.)
- Steyerberg, E. W.; Vickers, A. J.; Cook, N. R.; Gerds, T.; Gonen, M.; Obuchowski, N.; Pencina, M. J.; Kattan, M. W. (2010). Assessing the performance of prediction models. A framework for traditional and novel measures. Epidemiology. 21 (1): 128—138. doi:10.1097/EDE.0b013e3181c30fb2. (англ.)