Критерій узгодженості Пірсона
Критерій узгодженості Пірсона - один з найвідоміших критеріїв
, тому його часто і називають просто "критерій хі-квадрат". Використовується для перевірки гіпотези про закон розподілу.
Ґрунтується на групованих даних. Область значень передбачуваного розподілу
ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей попадання в інтервали групування й емпіричних частот.
Нехай X=(X1,…, Xn) — вибірка з розподілу
. Перевіряється проста гіпотеза
проти складної альтернативи
.
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом
.
Позначимо для j=1,…,k через
число елементів вибірки, що потрапили в інтервал
:
,
і через
— теоретичну ймовірність
попадання в інтервал
випадкової величини з розподілом
.
З необхідністю,
.
Як правило, довжини інтервалів вибирають так, щоб
.
Нехай
(1).
Зміст |
Зауваження [ред.]
Якщо розподіл вибірки
має такі ж, як в
, імовірності
попадання в кожний з інтервалів
, то по даній функції
ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції
з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей
такий, що
. Критерій
призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}
Правило критерію [ред.]
Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.
| Правило. Якщо отримана статистика перевищує квантиль розподілу заданого рівня значимості з або з ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості . |
Теорема Пірсона [ред.]
Якщо вірна гіпотеза H1', то при фіксованому k й при
: 
де, нагадаємо,
є
-розподіл зі
ступенем вільності.
Зауваження [ред.]
Насправді критерій
застосовують і для розв'язку первісного завдання про перевірку гіпотези
. Необхідно тільки пам'ятати, що цей критерій не заможний для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в
. Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.
Критерій Пірсона для перевірки параметричної гіпотези [ред.]
Критерій
часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка
з невідомого розподілу
.
Перевіряється складна гіпотеза:
,
де
— невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай
розбите на k>lінтервалів
, і
— число елементів вибірки, що потрапили в
. Але ймовірність
тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення:
(2.)
Нехай
- значення параметра
, що доставляє мінімум функції
при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки
, одержимо функцію відхилення:
.
Див. також [ред.]
Література [ред.]
- Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.
|
|
Цю статтю потрібно вікіфікувати, щоб привести її вигляд до стандартів Вікіпедії. (Червень 2010) |



з
або з
відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості