Пристосованість (статистика)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Пристосо́ваність (англ. goodness of fit) статистичної моделі описує, наскільки добре вона пристосована до набору спостережень. Міри пристосованості зазвичай роблять підсумок розбіжності між спостережуваними значеннями та значеннями, очікуваними за моделі, що розглядають. Такі міри можна використовувати в перевірці статистичних гіпотез, наприклад, для перевірки нормальності[en] залишків, для перевірки того, чи дві вибірки вибрано з ідентичних розподілів (див. критерій Колмогорова — Смирнова), чи для перевірки того, чи слідують виходові частоти певному розподілові (див. критерій хі-квадрат Пірсона). В дисперсійному аналізі однією зі складових, на яку розбивають дисперсію, може бути сума квадратів браку пристосованості[en].

Пристосованість розподілів[ред.ред. код]

При оцінюванні того, чи підходить даний розподіл до набору даних, можна використовувати наступні критерії та міри пристосованості, що лежать в їх основі:

Регресійний аналіз[ред.ред. код]

В регресійному аналізі з пристосованістю пов'язані такі предмети:

Категорійні дані[ред.ред. код]

Далі наведено приклади, що виникають у контексті категорійних даних.

Критерій хі-квадрат Пірсона[ред.ред. код]

Критерій хі-квадрат Пірсона використовує міру пристосованості, яка є сумою різниць між спостережуваними та очікуваними виходовими частотами (тобто, кількостями спостережень), кожну з яких піднесено до квадрату, й поділено на очікувану:

де

Oi = спостережувана частота (тобто, кількість) для засіку (англ. bin) i
Ei = очікувана (теоретична) частота для засіку i, підтримувана нульовою гіпотезою.

Очікування частоти обчислюється як

де

F = кумулятивна функція розподілу ймовірностей для розподілу, що перевіряють.
Yu = верхня (англ. upper) межа класу i,
Yl = нижня (англ. lower) межа класу i,
N = розмір вибірки

Отримуване в результаті значення можна порівнювати з розподілом хі-квадрат для визначення пристосованості. Для визначення ступенів вільності[en] розподілу хі-квадрат беруть загальне число спостережуваних частот і віднімають число оцінюваних параметрів. Тестова статистика слідує, приблизно, розподілові хі-квадрат з (kc) ступенями вільності, де k є числом не порожніх комірок, а c є числом оцінених параметрів розподілу (включно з параметрами положення, масштабу та форми).

Приклад: однакові частоти чоловіків та жінок[ред.ред. код]

Наприклад, щоби перевірити гіпотезу, що випадкову вибірку зі 100 людей вибрано із сукупності, в якій чоловіки та жінки є рівними за частотою, спостережуване число чоловіків та жінок порівнюватиметься з теоретичними частотами 50 чоловіків та 50 жінок. Якщо в вибірці було 44 чоловіки та 56 жінок, то

Якщо нульова гіпотеза є істинною (тобто, чоловіків та жінок вибирають з рівною частотою у вибірці), то тестову статистику вибиратимуть з розподілу хі-квадрат з одним ступенем вільності[en]. І хоча можна було би очікувати двох ступенів вільності (по одному для чоловіків та жінок), ми мусимо враховувати те, що загальне число чоловіків та жінок є обмеженим (100), і відтак є лише один ступінь вільності (2 − 1). Або ж, якщо кількість чоловіків є відомою, то кількість жінок є визначеною, і навпаки.

Результат звернення до розподілу хі-квадрат для 1 ступеню вільності показує, що ймовірність спостереження цієї відмінності (або екстремальнішої за цю), якщо чоловіки та жінки є однаково численними в генеральній сукупності, становить приблизно 0.23. Ця ймовірність є вищою за загальноприйнятий критерій статистичної значущості (.001-.05), тож звичайно ми не відкидатимемо нульову гіпотезу про те, що число чоловіків у сукупності є таким же, як і число жінок (тобто, ми розглядатимемо нашу вибірку як таку, що знаходиться в межах того, що ми би очікували для співвідношення чоловіків/жінок 50/50).

Біноміальний випадок[ред.ред. код]

Біноміальний експеримент є послідовністю незалежних проб, у якій проби можуть призводити в результаті до двох виходів, успіху чи відмови. Є n проб, кожна з імовірністю успіху, позначуваною через p. Якщо npi ≫ 1 для кожного i (де i = 1, 2, ..., k), то

Це приблизно має розподіл хі-квадрат з k − 1 ступенями вільності. Той факт, що ступенів вільності є k − 1, є наслідком обмеження . Ми знаємо, що є k спостережуваних лічильників клітин, проте щойно стають відомими будь-які k − 1, то один, що лишився, визначається однозначно. В принципі, можна сказати, що є лише k − 1 лічильників клітин, що визначаються вільно, звідси k − 1 ступенів вільності.

Інша міра пристосованості[ред.ред. код]

Статистика перевірки відношенням правдоподібностей є мірою пристосованості моделі, оцінюваною за тим, чи розширений вигляд моделі забезпечує істотно поліпшену пристосованість.

Див. також[ред.ред. код]