Тест Тьюкі адитивності

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

У статистиці, тест Тьюкі аддитивності[1], названий на честь Джона Тьюкі, є підходом, що використовується у двосторонній ANOVA (регресійний аналіз за участю двох якісних факторів), щоб оцінити, чи є змінні фактора адитивно пов'язаними з очікуваним значенням змінної відгуку. Він може застосовуватися, коли немає реплікації значень в наборі даних, ситуація, при якій неможливо безпосередньо оцінити повністю загальну неаддитивну структуру регресії і все ще мати інформацію для оцінки дисперсії помилки. Тестова статистика запропонована Тьюкі має одну ступінь свободи при нульовій гіпотезі, отже, його часто називають «тест Тьюкі з одним ступенем свободи».

Введення[ред.ред. код]

Найбільш поширеним урегулюванням для теста Тьюкі адитивності є двосторонній факторний аналіз дисперсії (ANOVA) з одним спостереженням на клітинку. Змінна результату Yij спостерігалася в таблиці з рядками проіндексованими i = 1,…, m , а стовпці проіндексовані j = 1,…, n . Рядки та стовпці зазвичай відповідають різним типам і рівням обробки, які застосовуються в комбінації.

Адитивна модель стверджує, що очікуваний результат може бути виражений так: EYij = μ + αi + βj, де αi та βj невідомі константи. Невідомі параметри моделі, як правило, оцінюється як:


\hat{\mu} = \bar{Y}_{\cdot\cdot}

\hat{\alpha}_i = \bar{Y}_{i\cdot} - \bar{Y}_{\cdot\cdot}

\hat{\beta}_j = \bar{Y}_{\cdot j} - \bar{Y}_{\cdot\cdot}.

де Yi — середнє i-того рядка таблиці даних, Yj — середнє j-того стовпчика таблиці даних, Y•• є спільним середнім всієї таблиці.

Адитивну модель може бути узагальнено, щоб врахувати довільні ефекти взаємодії, встановивши EYij = μ + αi + βj + γij . Однак після установки природної оцінки γij :


\hat{\gamma}_{ij} = Y_{ij} - (\hat{\mu} + \hat{\alpha}_i + \hat{\beta}_j),

Так, щоб він відповідав наступній величині:


\hat{Y}_{ij} = \hat{\mu} + \hat{\alpha}_i + \hat{\beta}_j + \hat{\gamma}_{ij} \equiv Y_{ij}

Таким чином не залишилося степенів свободи для оцінки дисперсії σ2 і ніякої перевірки гіпотез про γij не може виконуватись.

Тому Тьюкі пропонує обмеженішу модель взаємодії у вигляді:


EY_{ij} = \mu + \alpha_i + \beta_j + \lambda\alpha_i\beta_j

З перевіркою нульової гіпотези, що λ = 0 , ми можемо виявити деякі відхилення від адитивності на основі лише одного параметру λ .

Метод[ред.ред. код]

Для проведення тесту Тьюкі, встановіть:


SS_A \equiv n \sum_{i} (\bar{Y}_{i \cdot}-\bar{Y}_{\cdot\cdot})^2

SS_B \equiv m \sum_{j} (\bar{Y}_{\cdot j} - \bar{Y}_{\cdot\cdot})^2

SS_{AB} \equiv \frac{\sum_{ij} Y_{ij}(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})(\bar{Y}_{\cdot j}-\bar{Y}_{\cdot\cdot})}{\sum_{i} (\bar{Y}_{i \cdot}-\bar{Y}_{\cdot\cdot})^2  \sum_{j} (\bar{Y}_{\cdot j} - \bar{Y}_{\cdot\cdot})^2}

SS_T \equiv \sum_{ij} (Y_{i j} - \bar{Y}_{\cdot\cdot})^2

SS_E \equiv SS_T - SS_A - SS_B - SS_{AB}

Потім використовуйте наступну статистику тестів[2]:


\frac{SS_{AB}}{SS_E}.
.

При нульовій гіпотезі, статистика тестів має розподіл F =1, q степенів свободи, де q = mn − (m + n) є ступенями свободи для оцінки дисперсії помилки.

Див. також[ред.ред. код]

Пимітки[ред.ред. код]

  1. Tukey, John (1949). «One degree of freedom for non-additivity». Biometrics 5 (3). с. 232–242. doi:10.2307/3001938. JSTOR 3001938. 
  2. Alin, A. and Kurt, S. (2006). «Testing non-additivity (interaction) in two-way ANOVA tables with no replication». Statistical Methods in Medical Research 15, 63—85.

Джерела[ред.ред. код]

  1. Критерий Тьюки-Крамера на www.machinelearning.ru (рос.)
  2. Харченко М. А. Теория статистического вывода: Учебное пособие для вузов. — Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2008. — 80 с. (PDF) (рос.)