Коефіцієнт детермінації

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Коефіцієнт детермінації (позначається як R2 — R-квадрат) — статистичний показник, що використовується в статистичних моделях як міра залежності варіації залежної змінної від варіації незалежних змінних. Іншими словами, чисельно показує, яка частина варіації залежної змінної пояснена моделлю. Вказує, наскільки отримані спостереження підтверджують модель.

Коефіцієнт приймає значення від 0 до 1. Вважається, що чим ближче коефіцієнт до 1, тим кращою є модель. Коефіцієнт детермінації росте із кожним вступуючим до моделі предиктором (незалежною змінною). Однак, це зовсім не обов'язково зазначує перевагу моделі із більшим числом предикторів над моделлю із меншим числом предикторів. Тому, коефіцієнт детермінації має використовуватися лише як одна із метрик для посудження вірності моделі.

Формули[ред. | ред. код]

Коефіцієнт детермінації визначається наступним чином:

де  — умовна дисперсія залежної змінної.

Для розрахунку вибіркового коефіцієнта детермінації, використовують вибіркові оцінки значень відповідних дисперсій:

де - сума квадратів залишків регресії (резідуі),  — фактичні та оціночні значення пояснювальної (залежної) змінної.

 — загальна сума квадратів.

У випадку класичної лінійної множинної регресії (регресії з константою):

, де

І як наслідок:

Посилання[ред. | ред. код]

Див. також[ред. | ред. код]