Статистичний критерій

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Статистичний критерій — строге математичне правило, за яким приймається або відкидається та або інша статистична гіпотеза. Побудовою критерію є вибір відповідної функції від результатів спостережень (ряду емпірично набутих значень ознаки), яка служить для виявлення міри розбіжності між емпіричними значеннями і гіпотетичними.

Визначення[ред.ред. код]

Нехай дано вибірку \mathbf{X} = (X_1,\ldots,X_n) з невідомо сумісного розподілу \mathbb{P}^{\mathbf{X}}, і сім'я статистичних гіпотез H_0,H_1,\ldots. Тоді статистичним критерієм називається функція, що встановлює відповідність між величинами, що спостерігаються, і можливими гіпотезами:

f: \mathbb{R}^n \to \{H_0,H_1,\ldots\}.


Таким чином кожній реалізації вибірки \mathbf{x} = (x_1,\ldots,x_n) статистичний критерій зіставляє найбільш підходящу з точки зору цього критерію гіпотезу про розподіл, що породив дану реалізацію.

Види критеріїв[ред.ред. код]

Статистичні критерії підрозділяють на такі категорії:

  • Критерій значущості. Перевірка за значущістю припускає перевірку гіпотези про числові значення відомого закону розподілу:
H_0: \quad a=a_0нульова гіпотеза.
H_1: \quad a>a_0 \quad (a<a_0) або a\neq a_0альтернативна гіпотеза, що конкурує.
  • Критерій узгодженості.Перевірка на узгодженість має на увазі, що випадкова величина, що досліджується,підкорюється закону, що розглядається. Критерій узгодженості можна також сприймати, як критерій значущості.
  • Критерій однорідності.При перевірці на однорідність випадкові величини досліджуються на факт взаємної відповідності їх законів розподілу (чи підкорюються ці величини одному і тому ж закону). Використовуються у Факторному аналізі для визначення наявності залежностей.

Цей розділ умовний, і часто один і той же критерій може бути використаний в різних якостях.

Основні поняття[ред.ред. код]

  • Потужність критерію
  • Рівень критерію

Простий приклад[ред.ред. код]

Нехай дано незалежну вибірку \mathbf{X} = (X_1,\ldots,X_n)^{\top}, де X_i \sim \mathrm{N}(\mu,1),\quad i=1,\ldots,n. Нехай маємо дві прості гіпотези:

\begin{matrix}
H_0: & \mu = 0, \\
H_1: & \mu = 1.
\end{matrix}

Тоді можна визначити наступний статистичний критерій:

f(x_1,\ldots,x_n) = 
\left\{
\begin{matrix}
H_0, & \bar{x} \le 0.5 \\
H_1, & \bar{x} > 0.5,
\end{matrix}
\right.

де \bar{x} = \frac{1}{n}\sum\limits_{i=1}^n x_i - вибіркове середнє.

Непараметричні критерії[ред.ред. код]

Група статистичних критеріїв, які не включають в розрахунок параметри ймовірнісного розподілу і засновані на оперуванні частотами або рангами:

Параметричні критерії[ред.ред. код]

Група статистичний критеріїв, які включають в розранунок параметри ймовірнісного розподілу ознаки (середнього і дисперсії)

Дивіться також[ред.ред. код]