Міжквартильний розмах

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Міжквартильний або інтерквартильний розмах (англ. interquartile range, ) — робастна міра розсіяння, що розраховується на основі процентилів.  Поряд з розмахом та медіаною абсолютних відхилень відноситься до порядкових статистик, оскільки спирається на сортування (ранжування) даних.

Визначення[ред. | ред. код]

Найпростішою мірою розсіяння із порядкових статистик є розмах — різниця між найбільшим та найменшим значенням із вибірки[1]. Однак розмах дуже чутливий до викидів і тому є не дуже корисною мірою розсіяння.

Щоб запобігти чутливості до викидів, можна вдатися до відкидання з обох боків крайніх значень вибірки після їх розташування у варіаційний ряд шляхом перестановки даних таким чином, щоб кожне наступне значення було не менше за попереднє. Міжквартильний розмах — це різниця між 75-м та 25-м процентилями[2]:

.

75-й та 25-й процентилі – це такі значення варіаційного ряду,  що 75 та 25 відсотків (процентів) значень варіаційного ряду відповідно приймають значення рівні чи менші за ці значення.

75-й і 25-й процентилі називають ще третім та першим квартилем, тобто міжквартильний розмах — різниця між третім та першим квартилем. Звідси походить термін "міжквартильний".

Приклад[ред. | ред. код]

Нехай є вибірка значень 3, 1, 5, 3, 6, 7, 2, 9, варіаційнй ряд для якої має вигляд: 1, 2, 3, 3, 5, 6, 7, 9. Оскільки числа 1 та 2 складають 25 % від варіаційного ряду, числа 1, 2, 3, 3, 5 та 6 складають 75 % значень варіаційного ряду, то 75-й процентиль для цього ряду має значення 6, 25-й процентиль – 2. Тоді = 6 - 2 = 4.

Переваги та недоліки[ред. | ред. код]

На відміну від розмаху міжквартильний розмах нечутливий до викидів, може використовуватися для розподілів, для яких  не існує математичне сподівання та дисперсія. Недоліком цієї міри розсіяння є те, що вона дещо важча для розуміння, ніж розмах. Крім того, міжквартильний розмах незручний для математичних перетворень та для великих вибірок через необхідність ранжування даних вимагає великих затрат обчислювальних ресурсів.

Див. також[ред. | ред. код]

Вибірка

Міри розсіяння

Розмах

Примітки[ред. | ред. код]

  1. Гмурман В. Е. Теория вероятностей и математическая статистика. – М. : Высш. шк., 2003. – 479 с. ISBN 5-06-004214-6.
  2. Брюс П., Брюс Э. Практическая статистика для специалистов Data Science/Пер. с англ. - СПб: БХВ-Петербург, 2018. - 304 с: ил. ISBN 978-5-9775-3974-6.