Тест Грабса
У статистиці, тест Грабса (названий на честь Френка Е. Грабса, який опублікував тест у 1950 р.[1]), також відомий як максимальний нормалізований тест залишків або екстремальний стюдентізований тест відхилень є тестом, який використовується для виявлення викидів у одномірному наборі даних, який передбачається надходити з нормально розподіленої сукупності.
Тест Грабса базується на припущенні нормальності . Тобто перед застосуванням тесту Грабса слід спочатку перевірити, чи дані можна розумно апроксимувати нормальним розподілом.[2]
Тест Грабса виявляє по одному викиду за раз. Цей викид видаляється з набору даних, і тест повторюється, поки не буде виявлено викидів. Однак багаторазові ітерації змінюють ймовірність виявлення, і тест не слід використовувати для вибірок розмірами в шість значень чи менше, оскільки він часто позначає більшість точок як викиди.[3]
Тест Грабса визначається для гіпотези :
- H0 : У наборі даних немає викидів
- Ha : У наборі даних є лише один викид
Статистичні дані тесту Грабса визначаються як:
де та що позначає середнє значення вибірки та стандартне відхилення відповідно. Статистика випробування Грабса — це найбільше абсолютне відхилення від середнього значення вибірки в одиницях стандартного відхилення вибірки.
Це двосторонній тест, для якого гіпотеза про відсутність викидів відкидається на рівні значущості α, якщо
де t α/(2 N), N −2, позначає верхнє критичне значення t-розподілу з N - 2 ступенями свободи та рівнем значущості α/(2 N).
Тест Грабса можна також задати як односторонній тест, замінивши α/(2N) на α/N. Щоб перевірити, чи є мінімальне значення викидом, обчислюється значення статистики тесту :
де Y min, що позначає мінімальне значення. Щоб перевірити, чи є максимальне значення викидом, обчислюється значення статистики тесту:
де Y max позначає максимальне значення.
Для виявлення викидів можна і варто використовувати деякі графічні методи. Простий графік послідовності виконання, діаграма розмаху або гістограма повинні показувати будь-які очевидно віддалені точки. Графік нормального розподілу ймовірностей також може допомогти у вирішенні цієї задачі.
- ↑ Grubbs, Frank E. (1950). Sample criteria for testing outlying observations. Annals of Mathematical Statistics. 21 (1): 27—58. doi:10.1214/aoms/1177729885.
- ↑ Quoted from the Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
- ↑ Adikaram, K. K. L. B.; Hussein, M. A.; Effenberger, M.; Becker, T. (14 січня 2015). Data Transformation Technique to Improve the Outlier Detection Power of Grubbs' Test for Data Expected to Follow Linear Relation. Journal of Applied Mathematics (англ.). 2015: 1—9. doi:10.1155/2015/708948.
{{cite journal}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)
- Grubbs, Frank (February 1969). Procedures for Detecting Outlying Observations in Samples. Technometrics. Technometrics, Vol. 11, No. 1. 11 (1): 1—21. doi:10.2307/1266761. JSTOR 1266761.
- Stefansky, W. (1972). Rejecting Outliers in Factorial Designs. Technometrics. Technometrics, Vol. 14, No. 2. 14 (2): 469—479. doi:10.2307/1267436. JSTOR 1267436.