U-критерій Манна-Уітні

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

U-критерій Манна-Уітні (англ. Mann — Whitney U-test) — непараметричний статистичний критерій, що використовується для оцінки різниці між двома вибірками за рівнем будь-якої ознаки, виміряної якісно. Дозволяє виявити відмінності в значенні параметра між малими вибірками.

Інші назви: критерій Манна — Уітні — Уілкоксона (англ. Mann — Whitney — Wilcoxon, MWW), критерій суми рангів Уілкоксона (англ. Wilcoxon rank — sum test) або критерій Уілкоксона — Манна — Уітні (англ. Wilcoxon — Mann — Whitney test).

Історія[ред.ред. код]

Цей метод виявлення відмінностей між вибірками був запропонований у 1945 році Френком Уілкоксоном (F. Wilcoxon). У 1947 році він був істотно перероблений і розширений Х. Б. Манном (H. B. Mann) і Д. Р. Уітні (D. R. Whitney), на честь яких сьогодні зазвичай і називається.

Опис критерію[ред.ред. код]

Простий непараметричний критерій. Потужність критерію вища, ніж у Q -критерія Розенбаума.

Цей метод визначає, чи досить мала зона значень, що перехрещуються, між двома рядами (ранжируваним рядом значень параметра в першій вибірці і таким же в другій вибірці). Чим менше значення критерію, тим вірогідніше, що відмінності між значеннями параметра у вибірках достовірні.

Обмеження застосованості критерію[ред.ред. код]

  1. У кожній з вибірок повинно бути не менше 3 значень ознаки. Допускається, щоб в одній вибірці були два значення, але в другій тоді не менше п'ять.
  2. У вибіркових даних не повинно бути збігів значень (усі числа — різні) або таких збігів повинно бути дуже мало.

Використання критерію[ред.ред. код]

Для застосування U -критерію Манна — Уітні треба зробити такі операції:

  1. Скласти єдиний ранжируваний ряд з обох вибірок, що зіставляються, розставивши їхні елементи по мірі наростання ознаки і приписавши меншому значенню менший ранг. Загальна кількість рангів вийде рівною:
    N=n_1+n_2,
    де n_1 — кількість одиниць в першій вибірці, а n_2 — кількість одиниць в другій вибірці.
  2. Розділити єдиний ранжируваний ряд на два, що складаються відповідно з одиниць першої і другої вибірок. Підрахувати окремо суму рангів, що припали на долю елементів першої вибірки, і окремо — на долю елементів другої вибірки. Визначити більшу з двох рангових сум (T_x), таку, що відповідає вибірці з n_x одиниць.
  3. Визначити значення U -критерію Манна — Уітні за формулою:
    U=n_1\cdot n_2 + \frac{n_x\cdot(n_x+1)}{2}- T_x.
  4. За таблицею для обраного рівня статистичної значущості визначити критичне значення критерію для даних n_1 і n_2. Якщо набуте значення U менше табличного або дорівнює йому, то визнається наявність істотної відмінності між рівнем ознаки в даних вибірках (приймається альтернативна гіпотеза). Якщо ж набуте значення U більше за табличне, приймається нульова гіпотеза. Достовірність відмінностей тим вище, чим менше значення U.
  5. При справедливості нульової гіпотези критерій має математичне сподівання M(U)=\frac{n_1\cdot n_2}{2} і дисперсію D(U)=\frac{n_1\cdot n_2\cdot (n_1+n_2)}{12} і при достатньо великому об'ємі вибіркових даних (n_1>19,\;n_2>19) розподілений практично нормально.

Автоматичний розрахунок U -критерію Манна — Уітні[ред.ред. код]

Таблиця критичних значень[ред.ред. код]

Література[ред.ред. код]

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947. — № 18. — P. 50—60. (англ.)
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. — 1945. — P. 80-83. (англ.)
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. — Л., 1973. (рос.)
  • Турчин В. М. Математична статистика: Посіб.. — К. : Видавничий центр «Академія», 1999. — 240с.

Див. також[ред.ред. код]