Перевірка статистичних гіпотез

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Перевірка статистичних гіпотез — клас базових задач в математичній статистиці.

Статистичні гіпотези[ред.ред. код]

Визначення[ред.ред. код]

Нехай у (статистичному) експерименті спостерігається реалізація деякої випадкової величини , розподіл якої невідомий повністю чи частково. Тоді будь-яке твердження, що стосується , називається статистичною гіпотезою. Гіпотези розрізняються за видом припущень, що містяться в них:

  • Статистична гіпотеза, що однозначно визначає розподіл , тобто , де якийсь конкретний закон, що має назву простий.
  • Статистична гіпотеза, що стверджує, що розподіл належить до деякої сім'ї розподілів, тобто виду , де  — сім'ю розподілів, що має назву складна.

На практиці зазвичай потрібно перевірити якусь конкретну і, як правило, просту гіпотезу . Таку гіпотезу прийнято називати нульовою. При цьому паралельно розглядається гіпотеза, що протирічить їй , що називається конкуруючою або альтернативною.

Висунута гіпотеза потребує перевірки, яка здійснюється статистичними методами, тому гіпотезу називають статистичною. Для перевірки гіпотези використовують критерії, що дозволяють прийняти або спростувати гіпотезу.

В більшості випадків статистичні критерії засновані на випадковій вибірці фіксованого об'єму з розподілу . У послідовному аналізі вибірка формується в ході самого експерименту і тому її об'єм є випадковим величиною.

Приклад[ред.ред. код]

Нехай дано незалежну вибірку з нормального розподілу, де  — невідомий параметр. Тоді , де  — фіксована стала, є простою гіпотезою, а альтернативна до неї  — складною.

Етапи перевірки статистичних гіпотез[ред.ред. код]

  1. Формулювання основної гіпотези і конкуруючої гіпотези . Гіпотези повинні бути чітко формалізовані в математичних термінах.
  2. Задання вірогідності , що називається рівнем значущості і що відповідає помилкам першого роду, на якому надалі і буде зроблений висновок про правдивість гіпотези.
  3. Розрахунок статистики критерію такий, що:
    • її величина залежить від початкової вибірки ;
    • за її значенням можна зробити висновки про істинність гіпотези ;
    • сама статистика повинна підкорятися якомусь невідомому закону розподілу, так як сама є випадковою в силу випадковості .
  4. Побудова критичної області. З області значень виділяємо підмножину таких значень, за якими можна судити про суттєвість розбіжностей з припущенням. Її розмір вибирається таким чином, щоб виконувалась рівність . Ця множина і називається критичною областю.
  5. Висновок про істинність гіпотези. Спостережувані значення вибірки підставляються в статистику і за попаданням (або непопаданням) у критичну область виноситься ухвала про відкидання (або ухвалення) висунутої гіпотези .

Види критичної області[ред.ред. код]

  • Двобічна критична область визначається двома інтервалами , де знаходять з умов .
  • Лівобічна критична область визначається інтервалом , де знаходять з умови .
  • Правобічна критична область визначається інтервалом , де знаходять з умови .

Див. також[ред.ред. код]

Джерела[ред.ред. код]



Статистика Це незавершена стаття зі статистики.
Ви можете допомогти проекту, виправивши або дописавши її.