Правило 68–95–99,7

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Для наближено нормально розподіленої вибірки, значеннях в межах стандартного відхилення від середнього складають приблизно 68 % вибірки; у той час, як в межах двох стандартних відхилень налічуватиметься близько 95 %; а в межах трьох стандартних відхилень налічуватиметься близько 99,7 % елементів. Наведені відсотки є лише округленими значеннями теоретичних імовірностей, що призначені лише для апроксимації емпіричних даний отриманих при нормальній вибірці.

У статистиці, правило 68–95–99,7 — скорочення, яке допомагає запам'ятати процент значень які знаходяться в діапазоні довкола середнього значення в нормальному розподілі із шириною у два, чотири й шість стандартних відхилень, відповідно; точніше, 68,27 %, 95,45 % і 99,73 % значень знаходяться в межах одного, двох і трьох стандартних відхилень від середнього, відповідно.

У математичній нотації, ці факти можна виразити наступним чином, де — це спостереження нормально розподіленої випадкової величини, є середнім розподілом, а  — стандартне відхилення:

В емпіричних науках це правило називається емпіричним правилом трьох сигм що виражає загальноприйняте евристичне правило, що майже всі можливі значення знаходяться в межах трьох стандартних відхилень від середнього, і таким чином емпірично корисно трактувати це як 99,7 % імовірності, що є мірою найближчої імовірності.[1]

Застосованість цього евристичного правила значно залежить від задачі дослідження. У соціології, результат можуть вважати «ймовірним», якщо його довірчий інтервал знаходиться в межах двох сигм (95 %), у той час, як у фізиці елементарних частинок, загальноприйнято, що необхідно п'ять сигм (99,99994 % імовірності), аби провести якісне дослідження, яке можна віднести до наукового відкриття.

«Емпіричне правило трьох сигм» тісно пов'язане з іншим результатом також відомим як правило трьох сигм, який стверджує, що навіть для величин які не мають нормального розподілу, принаймні 88,8 % випадків повинні потрапити в межі правильно розрахованого інтервалу трьох сигм. Це правило випливає із Нерівності Чебишова. Для унімодальних розподілів імовірність потрапляння в інтервал становить близько 95 %. Також можуть існувати деякі припущення, які розширюють значення цієї ймовірності до 98 %.

Примітки

[ред. | ред. код]
  1. таке використання «емпіричного правила трьох сигм» увійшло до загального вжитку у 2000-их, наприклад, це згадується в Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003. с. 359, і в Grafarend, Erik W. (2006). Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. с. 553.

Джерела

[ред. | ред. код]

Посилання

[ред. | ред. код]