t-критерій Стьюдента

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

t-критерій Стьюдента/Ст'юдента — загальна назва для класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на порівнянні з розподілом Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках[1].

Історія[ред.ред. код]

Цей критерій був розроблений Вільямом Госсеттом для оцінки якості пива в компанії Ґіннес. У зв'язку із зобов'язаннями перед компанією по нерозголошуванню комерційної таємниці (якою керівництво Гіннесу вважало таке використання статистичного апарату в своїй роботі), стаття Госсета вийшла в 1908 році в журналі «Біометрика» під псевдонімом «Student» (Студент)[2].

Вимоги до даних[ред.ред. код]

Для застосування даного критерію необхідно аби початкові дані мали нормальний розподіл. У разі застосування двохвибіркового критерію для незалежних виборок також необхідне дотримання умови рівності дисперсій. Існують, проте, альтернативи критерію Стьюдента для ситуації з нерівними дисперсіями.

Двовибірковий t-критерій для незалежних вибірок[ред.ред. код]

У випадку з розміром вибірки, що трохи відрізняється, застосовується спрощена формула наближених розрахунків:

 t = \frac{|M_1 - M_2|}{\sqrt{\frac{\sigma_1^2}{N_1}+\frac{\sigma_2^2}{N_2}}}

У випадку, якщо розмір вибірки відрізняється значно, застосовується складніша і точніша формула:

 t = \frac{|M_1 - M_2|}{\sqrt{\frac{(N_1 - 1)\sigma_1^2 + (N_2 - 1)\sigma_2^2}{N_1 + N_2 - 2}(\frac{1}{N_1}+\frac{1}{N_2})}}

Де M_1, M_2 — середнє арифметичне, \sigma_1, \sigma_2 — стандартне відхилення, а N_1, N_2 — розміри вибірок.

Кількість ступенів свободи розраховують як

\,df = N_1 + N_2 - 2

Двовибірковий t-критерій для залежних вибірок[ред.ред. код]

Для обчислення емпіричного значення t-критерію в ситуації перевірки гіпотези про відмінності між двома залежними вибірками (наприклад, двома пробами одного і того ж тесту з часовим інтервалом) застосовується наступна формула:

t = \frac {|M_d|}{\sigma_d / \sqrt {N}}

де M_d — середня різниця значень, а \sigma_d — стандартне відхилення різниць.

Кількість ступенів свободи розраховують як

\,df = N - 1

Одновибірковий t-критерій[ред.ред. код]

Застосовується для перевірки гіпотези про відмінність середнього значення \,M_x від деякого відомо значення \,A:

t = \frac{|M_x - A|}{\sigma / \sqrt{N}}

Кількість ступенів свободи розраховують як

\,df = N - 1

Непараметричні аналоги[ред.ред. код]

Аналогом двостороннього критерію для незалежних вибірок є U-критерій Манна-Уітні. Для ситуації із залежними вибірками аналогами є критерій знаків і T-критерій Вілкоксона.

Див. також[ред.ред. код]

Посилання[ред.ред. код]

Інтернет посилання[ред.ред. код]