Теорія оцінювання

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Теорія оцінювання — це галузь статистики, яка вивчає способи оцінювання значень параметрів на основі емпіричних/виміряних даних, що мають випадкову складову. Ці параметри описують належне фізичне середовище таким чином, що їхні значення впливають на розподіл виміряних даних. Статистична оцінка дозволяє оцінити ці невідомі параметри на основі даних вимірювань.

Наприклад, необхідно оцінити частину сукупності виборців, які голосуватимуть за певного кандидата. Це співвідношення є шуканим параметром; оцінка ґрунтується на невеликій випадковій вибірці людей, що голосують.

Або, наприклад, задача радару полягає в тому, щоб оцінити віддаленість об'єктів (літаків, човнів тощо) шляхом аналізу часу двобічного проходження отриманих віддзеркалень переданих імпульсів. Оскільки відбиті імпульси неминуче включатимуться в електричний шум, їхні виміряні значення матимуть випадковий розподіл, тому цю тривалість проходження потрібно оцінювати.

У теорії статистичного оцінювання зазвичай розглядають два основні підходи:[1]

  • Ймовірнісний підхід ґрунтується на припущенні, що вимірювані дані є випадковими і мають деякий розподіл ймовірностей, що залежить від параметрів, які необхідно знайти
  • Множинний підхід[en] ґрунтується на припущенні, що виміряний вектор даних належить до множини, що залежить від вектора параметрів.

Наприклад, в теорії електросигналів вимірювання, що містять інформацію про шукані параметри, часто пов'язані із зашумленим сигналом. Без наявності випадковості, або шуму, задача була би детермінованою, і оцінювання не було би потрібним.

Приклади[ред. | ред. код]

Наприклад, бажано оцінити частку населення виборців, яке проголосує за конкретного кандидата. Ця пропорція — шуканий параметр; оцінка базується на невеликій випадковій вибірці виборців. Як альтернативу бажано оцінити ймовірність голосування виборців за конкретного кандидата, виходячи з деяких демографічних особливостей, таких як вік.

Або, наприклад, у радіолокації метою є пошук діапазону об'єктів (літаки, катери тощо) шляхом аналізу двостороннього часу транзиту прийнятих відлунь переданих імпульсів. Оскільки відбиті імпульси неминуче вбудовуються в електричний шум, їх виміряні значення випадковим чином розподіляються так, що час проходження потрібно оцінити.

Іншим прикладом у теорії електричного зв'язку можуть бути вимірювання, що містять інформацію щодо цікавих параметрів, які часто пов'язано з шумним сигналом.

Основи[ред. | ред. код]

Щоб оцінювач могло бути втілено, для заданої моделі потрібно кілька статистичних «складових». Першим з них є статистична вибірка — набір точок даних, взятих із випадкового вектора (RV) розміру N. Покласти до вектору,

По-друге, є M параметрів

значення яких слід оцінити. По-третє, функція безперервної густини ймовірності (ФГІ) або її дискретний аналог, функція маси ймовірності (ФМІ) основного розподілу, що породжує дані, повинно бути вказано залежно від значень параметрів:

Також можливо, щоби самі параметри мали розподіл імовірностей (наприклад, баєсову статистику). Потім необхідно визначити баєсову ймовірність

Після формування моделі мета полягає в оцінці параметрів, причому оцінки зазвичай позначають через , де «капелюх» означає оцінку.

Одним із загальних оцінювачів є оцінювач мінімальної середньоквадратичної похибки[en] (МСКП), який використовує похибку між оцінюваними параметрами та фактичним значенням параметрів

як основу для оптимальності. Потім цей член похибки подносять до квадрату, а очікуване значення цього квадрату мінімізують для оцінювача МСКП.

Оцінювачі[ред. | ред. код]

До загальновживаних оцінювачі (методів оцінювання) та тем, пов'язані з ними, належать:

Приклади[ред. | ред. код]

Невідома константа адитивного білого гауссового шуму[ред. | ред. код]

Розгляньмо отриманий дискретний сигнал, , з незалежних зразків, що складається з невідомої сталої з адитивним білим гауссовим шумом (АБГШ) з нульовим середнім значенням та відомою дисперсією (тобто, ). Оскільки дисперсія є відомою, то єдиним невідомим параметром є .

Тоді моделлю для сигналу є

Двома можливими (з багатьох) оцінювачами параметра є:

Обидві ці оцінювачі мають середнє значення , яке можливо показати, взявши математичне сподівання кожного з оцінювачів

та

На даний момент ці два оцінювачі, здається, виконують однакові дії. Однак різниця між ними стає очевидною при порівнянні дисперсій.

та

Видається, що середнє значення вибірки є кращим оцінювачем, оскільки його дисперсія нижча для кожного N > 1.

Максимальна ймовірність[ред. | ред. код]

Продовжуючи приклад, використовуючи оцінювач методу максимальної правдоподібності, густиною ймовірності (ФГІ) шуму для одного зразку є

І ймовірність стає ( можливо розглядати як )

Згідно незалежності, ймовірність стає

Беручи натуральний логарифм ФГІ

а оцінювач максимальної правдоподібності —

Беремо першу похідну функції логарифмічної правдоподобності

і встановлюємо її в нуль

Це дає оцінку максимальної ймовірності

Що є просто середнім значенням вибірки. З цього прикладу було встановлено, що середнє значення вибірки є оцінювачем максимальної правдоподібності для зразків фіксованого, невідомого параметра, спотвореного АБГШ.

Нижня межа Крамера-Рао[ред. | ред. код]

Щоби знайти нижню межу Крамера — Рао (НМКР) оцінювача середнього значення вибірки, спочатку необхідно знайти значення інформації за Фішером

і, скопіювавши зверху,

Взяття другої похідної

та пошук від'ємного математичного сподівання є тривіальними, оскільки тепер це є детермінованою сталою

Нарешті, підставлення цієї інформації за Фішером до

дає в результаті

Порівняння цього з дисперсією вибіркового середнього (визначеною раніше) показує, що вибіркове середнє дорівнює нижній межі Крамера — Рао для всіх значень та . Іншими словами, вибіркове середнє є (обов'язково унікальним) ефективним оцінювачем, а отже, також мінімально-дисперсійним незміщеним оцінювачем[en] (МДНО), крім того, що є оцінювачем максимальної ймовірності.

Максимум рівномірного розподілу[ред. | ред. код]

Одним з найпростіших нетривіальних прикладів оцінки є оцінка максимуму рівномірного розподілу. Його використовують як практичну вправу в класних заняттях, та для ілюстрування основних принципів теорії оцінювання. Далі, у випадку оцінки на основі одного зразку, вона демонструє філософські проблеми та можливі непорозуміння при використанні оцінювачів максимальної ймовірності та функцій правдоподібності.

Для заданого дискретного рівномірного розподілу з невідомим максимумом оцінювач МДНО[en] для максимуму задають як

де m — максимум вибірки[en], а k — обсяг вибірки, вибирання без повертання.[2][3] Ця задача є широко відомою як задача про німецькі танки[en], завдяки застосуванню максимального оцінювання до оцінювання виробництва німецьких танків під час Другої світової війни.

Формулу можливо інтуїтивно розуміти як

«Максимум вибірки плюс середній розрив між спостереженнями у вибірці»,

розрив додається для компенсації негативного зміщення максимуму вибірки як оцінки максимуму сукупності.[a]

Це має дисперсію[2]

а отже, стандартне відхилення приблизно , середній (за сукупністю) розмір розриву між зразками; порівняйте з вище. Це можливо розглядати як дуже простий випадок максимально-інтервальної оцінки[en].

Вибірковий максимум є максимально-правдоподібнісним оцінювачем для максимуму сукупності, але, як обговорювалося вище, він є зміщеним.

Застосування[ред. | ред. код]

Використання теорії оцінювання вимагають численні галузі. До них, зокрема, належать:

Вимірювані дані можуть бути схильні до шуму або невизначеності, і саме через статистичну ймовірність шукають оптимальні рішення для витягування якнайбільше інформації з даних.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

Коментарі[ред. | ред. код]

  1. Максимум вибірки ніколи не перевищує максимум сукупності, але може бути і меншим, отже, це зміщений оцінювач: він буде схильним недооцінювати максимум сукупності.

Джерела[ред. | ред. код]

  1. Вальтер, E.; Пронзато, Л. (1997). Ідентифікація параметричних моделей за експериментальним даними. Лондон, Англія: Springer-Verlag.
  2. а б Джонсон, Роджер (1994), Оцінка чисельності населення, Статистика викладання, 16 (2 (літо)): 50—52, doi:10.1111/j.1467-9639.1994.tb00688.x
  3. Джонсон, Роджер (2006), Оцінка чисельності населення, Отримання Найкращого із Статистики Викладання, архів оригіналу (PDF) за Листопад 20, 2008

Література[ред. | ред. код]

Посилання[ред. | ред. код]