Коробковий графік

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Коробковий графік з даними експерименту Майкельсона—Морлі
Box-Plot mit Interquartilsabstand.png
Fourboxplots.svg
«ящик з вусами» та густина ймовірності нормалі населення

Коро́бковий гра́фік або гра́фік «я́щик з ву́сами» — засіб візуалізації в описовій статистиці груп числових даних через їх квантилі. Коробковий графік може також мати лінії, які виходять вертикально з коробки (вони називаються вусами), вони вказують величину мінливості поза верхньою та нижньою межами квантиля. Викиди[en] може бути нанесено у вигляді точок.

Коробковий графік робить відмінності між сукупністю змінних, не роблячи ніяких припущень базового статистичного розподілу: вони є непараметричними[en]. Відстані між різними частинами коробки вказують на ступінь дисперсії (розкиданості) та асиметрії в даних, і визначають викиди[en]. Крім самих точок, вони дозволяють візуально дати різні статистичні оцінки.

Альтернативні форми[ред.ред. код]

«Ящик з вусами» є однорідним щодо використання ящика: нижня та верхня сторони ящика завжди є першим і третім квантилем, а група всередині коробки завжди другим квантилем (медіана). Але кінці вусів можуть представляти кілька можливих альтернативних значень, серед яких:

  • мінімум та максимум даних
  • найнижче значення даних, який знаходиться ще в межах 1,5 IQR нижнього квантиля, а найвище значення, який ще в межах 1,5 IQR верхнього квантиля (як показано на малюнку)
  • одне стандартне відхилення вище і нижче середніх даних
  • 9-та процентиль і 91-ша процентиль
  • 2-га процентиль і 98-ма процентиль.

Будь-які дані, що включено між вусами, повинно бути нанесено на графік як ізольовані точки, малим колом, або зіркою, але інколи можна цього не робити.

Деякі «ящики з вусами» включають додаткові символи, які являють собою середні значення даних. На деяких ділянках коробкового графіку штрихування намальоване на кожному з вусів, перед кінцем вусів.

Рідко, коробковий графік може бути представленим взагалі без яких-небудь вусів.

Незвичні процентилі 2%, 9%, 91%, 98% іноді використовуються для поперечно заштрихованих ділянок вусів та кінців вусів, щоб показати результат з сімома числами. Якщо дані мають нормальний розподіл, місця розташування з семи міток на графіці будуть рівномірно розподілені.

Варіації[ред.ред. код]

Дві з найбільш поширених варіацій графіку — це зміна ширини ящика та зубчастий механізм. Зміна ширина ящика ілюструє розмір кожної групи даних. Поширений варіант розшириння ящика — змінити ширину таким чином, щоб вона була пропорційна квадратному кореню з розміру групи. Ширина мітки пропорційна діапазону квантиля і обернено пропорційна квадратному кореню з розміру зразка. Тим не менш, існує невизначеність щодо найбільш відповідних множників (оскільки він може змінюватись в залежності від подібності дисперсії вибірки). Один зі звичаїв полягає у використанні +/-1.58*IQR/sqrt(n) .

Візуалізація[ред.ред. код]

«Ящик з вусами» — це швидкий спосіб вивчення одного або декількох наборів даних у графічному вигляді. «Ящик з вусами» може здатися примітивнішим за оцінку гістограми або ядерну оцінку густини розподілу, але цей метод має деякі переваги. Коробковий графік займає менше місця і тому особливо корисний для порівняння розподілу між кількома групами або наборами даних.

Див. також[ред.ред. код]