Стандартне відхилення
Станда́ртне відхи́лення (англ. standard deviation) або середнє квадратичне відхилення, позначається як S або σ. — у теорії ймовірності і статистиці найпоширеніший показник розсіювання значень випадкової величини відносно її математичного сподівання. Вимірюється в одиницях виміру самої випадкової величини.
По суті, якщо взяти прикладні задачі, то стандартне відхилення — це найбільш використовуваний індикатор мінливості об'єкта, що показує, на скільки в середньому відхиляються індивідуальні значення ознаки
від їх середньої величини
[1].
Зміст |
Використання [ред.]
Стандартне відхилення використовують під час розрахунку стандартної похибки середнього арифметичного, для побудови довірчих інтервалів, статистичної перевірки гіпотез, виміру лінійного взаємозв'язку між випадковими величинами.
Обчислення [ред.]
Середньоквадратичне відхилення — дорівнює кореню квадратному з дисперсії випадкової величини:
Відповідно до формул з обчислення дисперсії:

,
при невеликій вибірці (n<=40—-50)[1] вводиться поправка Бесселя:
де:
— стандартне відхилення, незміщена оцінка средньоквадратичного відхилення випадкової величини X відносно її математичного сподівання;
— дисперсія;
— i-й елемент вибірки;
— середнє арифметичне вибірки: : 
— обсяг (розмір) вибірки.
Слід звернути увагу на відмінність стандартного відхилення (у знаменнику
) від кореня з дисперсії (у знаменнику
). Для малих обсягів вибірки оцінка дисперсії є дещо зміщеною на величину n/(n-1), для нескінченно великого обсягу вибірки різниця між вказаними величинами зникає.
Вибірка — лише частина генеральної сукупності. Генеральна сукупність — абсолютно всі можливі результати. Отримати результат, що не входить в генеральну сукупність абсолютно неможливо в принципі. Для випадку з киданням монети генеральною сукупністю є : решка, ребро, орел. А ось пара орел-решка — вже лише вибірка. Для генеральної сукупності математичне очікування збігається зі справжнім значенням оцінюваного параметра. А ось для вибірки — не факт. Математичне очікування вибірки має зміщення (зсув?) щодо дійсного значення параметра. Через це середньоквадратична помилка більша ніж дисперсія, оскільки дисперсія — математичне очікування квадрата відхилення від середнього значення, а середньоквадратичне відхилення — математичне очікування відхилення від справжнього значення. Різниця в тому, від чого шукаємо відхилення: коли дисперсія, то від середнього (і не важливо достеменне це середнє чи помилкове), а коли середньоквадратичне відхилення, то це відхилення від справжнього середнього значення.
Суть стандартного відхилення (приклади) [ред.]
Розглянемо наступний приклад, де є дві вибірки даних[2]:
- 1, 2, 3, 4, 5
- -235, -103, 3, 100, 250
З сукупностей очевидно, що вони різні. Якщо порахувати середнє арифметичне, то отримуємо в обох випадках 3. Проте,в першої вибірки дані більше розсіяні довкола центру, а в другому випадку більше сконцентровані в центрі. Таким чином говорять, що в другої вибірки велике стандартне відхилення, а в першої незначне. Якщо підставити і порахувати дані відхилення, то отримаємо σ1=1,6, а σ2=186. Різниця суттєва.
Здебільшого вибірки не відрізняються настільки, як це в попередньому випадку. Наприклад, при проведенні ряду вимірювань отримали дві вибірки[3]:
- x1: 10, 15, 20, 25, 30, 40, 45, 50
- x2: 10, 28, 28, 30, 30, 32, 32, 50
В обох випадку середні рівні 30, крім того у них однакові границі. Проте σ1=13,7, а σ2=10,1. Тобто, видно, що при однакових границях і ширині варіації дисперсія і стандартне відхилення виявляються неоднакові: на величини цих показників вплинув різний характер варіювання ознак об'єкта (іншими словами мінливість даних в вибірці).
Стандартне відхилення в ряді випадків виявляється кращим для використання ніж дисперсія, по тій причині, що виражається в тих же одиницях, що і середня арифметична величина.
Порівняння особливостей розподілу варіант у різних виборках лише за показниками нормованого відхилення (σ) недостатньо, а іноді неможливо (коли необхідність порівнювати варіаційні ряди де ознаки вимірювалися в різних одиницях вимірювання, наприклад, одна вибірка вага людини в кілограмах, а інша ріст людини в сантиметрах). Для таких порівнянь застосовується відносний показник, який позначається символом t і зветься нормованим відхиленням[4].
Правило 3-х сигм [ред.]
Правило 3-х сигм (
) — практично всі значення нормально розподіленної випадкової величини лежать в інтервалі
. Точніше — не менш, ніж із 99,7% достовірністю, значення нормально розподіленої випадкової величини лежить у вказаному інтервалі (за умови що величина
достеменно відома, а не отримана в результаті обробки вибірки). Якщо істинне значення величини невідоме, то слід користуватися не
, а
. Таким чином правило 3-х сигм перетвориться в правило трьох
.
Див. також [ред.]
Посилання [ред.]
- ↑ а б Анализ статистической совокупности в программе MS EXCEL
- ↑ Стандартное отклонение
- ↑ Лакин Г.Ф. Биометрия: Учеб. пособие для биол. спец. вузов. - М: Высш. шк., 1990. - 352 с. - с. 42
- ↑ Калінін М.І., Єлісєєв В.В. Біометрія: Підручник для студентів вузів біологічних і екологічних напрямків. - Миколаїв: Вид-во МФ НаУКМА, 2000. - 204 с. - C. 50-51




,