Перевірка статистичних гіпотез
Перевірка статистичних гіпотез — клас базових задач в математичній статистиці.
Зміст |
Статистичні гіпотези [ред.]
Визначення [ред.]
Нехай у (статистичному) експерименті спостерігається реалізація
деякої випадкової величини
, розподіл якої
невідомий повністю чи частково. Тоді будь-яке твердження, що стосується
, називається статистичною гіпотезою. Гіпотези розрізняються за видом припущень, що містяться в них:
- Статистична гіпотеза, що однозначно визначає розподіл
, тобто
, де
якийсь конкретний закон, що має назву простий. - Статистична гіпотеза, що стверджує, що розподіл
належить до деякої сім'ї розподілів, тобто виду
, де
— сім'ю розподілів, що має назву складна.
На практиці зазвичай потрібно перевірити якусь конкретну і, як правило, просту гіпотезу
. Таку гіпотезу прийнято називати нульовою. При цьому паралельно розглядається гіпотеза, що протирічить їй
, що називається конкуруючою або альтернативною.
Висунута гіпотеза потребує перевірки, яка здійснюється статистичними методами, тому гіпотезу називають статистичною. Для перевірки гіпотези використовують критерії, що дозволяють прийняти або спростувати гіпотезу.
В більшості випадків статистичні критерії засновані на випадковій вибірці
фіксованого об'єму
з розподілу
. У послідовному аналізі вибірка формується в ході самого експерименту і тому її об'єм є випадковим величиною.
Приклад [ред.]
Нехай дано незалежну вибірку
з нормального розподілу, де
— невідомий параметр. Тоді
, де
— фіксована стала, є простою гіпотезою, а альтернативна до неї
— складною.
Етапи перевірки статистичних гіпотез [ред.]
- Формулювання основної гіпотези
і конкуруючої гіпотези
. Гіпотези повинні бути чітко формалізовані в математичних термінах. - Задання вірогідності
, що називається рівнем значущості і що відповідає помилкам першого роду, на якому надалі і буде зроблений висновок про правдивість гіпотези. - Розрахунок статистики
критерію такий, що:
- її величина залежить від початкової вибірки
; - за її значенням можна зробити висновки про істинність гіпотези
; - сама статистика
повинна підкорятися якомусь невідомому закону розподілу, так як сама
є випадковою в силу випадковості
.
- її величина залежить від початкової вибірки
- Побудова критичної області. З області значень
виділяємо підмножину
таких значень, за якими можна судити про суттєвість розбіжностей з припущенням. Її розмір вибирається таким чином, щоб виконувалась рівність
. Ця множина
і називається критичною областю. - Висновок про істинність гіпотези. Спостережувані значення вибірки підставляються в статистику
і за попаданням (або непопаданням) у критичну область
виноситься ухвала про відкидання (або ухвалення) висунутої гіпотези
.
Види критичної області [ред.]
- Двобічна критична область визначається двома інтервалами
, де
знаходять з умов
. - Лівобічна критична область визначається інтервалом
, де
знаходять з умови
. - Правобічна критична область визначається інтервалом
, де
знаходять з умови
.
Дивіться також [ред.]
| Ця стаття не містить посилань на джерела. (жовтень 2010) |

, де
якийсь конкретний закон, що має назву простий.
, де
— сім'ю розподілів, що має назву складна.
, що називається рівнем значущості і що відповідає помилкам першого роду, на якому надалі і буде зроблений висновок про правдивість гіпотези.
критерію такий, що:
;
.
таких значень, за якими можна судити про суттєвість розбіжностей з припущенням. Її розмір вибирається таким чином, щоб виконувалась рівність
. Ця множина
, де
знаходять з умов
.
, де
знаходять з умови
.
, де
знаходять з умови
.