Медіана (статистика)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Медіа́на (англ. median) — 1. В статистиці величина ознаки, що розташована по середині ранжованого ряду вибірки[1], тобто — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку[2]. 2. В теорії ймовірності — характеристика розподілення випадкової величини.

Медіана ділить ряд значень ознаки на дві рівні частини, по обидві частини від неї розміщується однакова кількість одиниць сукупності.[1] Медіана є квантилем порядку 1/2. Позначається як \tilde{x} або x_{1/2}\,.

Визначення[ред.ред. код]

Медіаною функції розподілу F називається таке число \tilde{x}, що:[3]

F(\tilde{x}) = 1/2,

або:[4]

P(X < \tilde{x}) = P(X > \tilde{x}) = 1/2,

тобто, ймовірність того, що випадкова величина матиме значення більше або менше за медіану однакова і дорівнює 1/2.

Якщо функція розподілу строго монотонна, то медіана визначається однозначно, в протилежному випадку, розв'язком рівняння \tilde{x} = F^{-1}(x) є відрізок [\underline{x}, \overline{x}]. З точки зору теорії ймовірностей, значення з цього відрізку можна не розглядати. Таким чином, неоднозначність цього рівняння неістотна. Аби уникнути пов'язаних з цієї неоднозначностей проблем, медіаною можна вважати найменший корінь рівняння: \tilde{x} = \underline{x}.[3]

З геометричної точки зору, вертикальна пряма x = \tilde{x}, що проходить через точку з абсцисою \tilde{x} ділить площу фігури під кривою функції розподілу на дві рівні частини.[4]

Історія[ред.ред. код]

Поняття медіани походить з книги Едварда Райта про навігацію («Помилки в навігації» 1599 року), в розділі з приводу визначення розташування за допомогою компаса. Він зрозумів, що вірогідніше всього, це значення може бути правильним в серіях спостережень.

У 1757 році Роджер Джосеф Бошкович розвивав регресивний метод, заснований на нормі L1 і на медіані[5]. У 1774 році Лаплас запропонував використати медіану як стандартний оцінювач значення пізнішого pdf. Специфічні критерії мали мінімізувати очікувану величину помилки; |\alpha - \alpha^*| , де α* — оцінка, і α — справжня цінність.

Критерій Лапласа був загалом знехтуваний протягом 150 років на користь найменшого методу квадратів Гауса і Легенгре, який мінімізує значення (\alpha - \alpha^*)^2, щоб отримати середину[6]. Поширення як типового означення, так і типової медіани були визначені Лапласом на початку 1800 року[7]. Антуан Августин Курно в 1843 році був першим, хто використав термін «медіана», як значення, яке ділить розподіл вірогідності на дві рівні частини.

Густав Теодор Фішнер використовував медіану (Centralwerth) в соціологічних і психологічних явищах[8].

Густав Фішнер популяризував медіану у формальному аналізі даних, хоча це вперше зробив Лаплас[8]. Франциск Гальтон вжив англійський термін «медіана» в 1881 році,[9] раніше використовуючи «середина найбільшого значення» (1869 рік) і як «середина» в 1880 році.

Медіана варіаційного ряду[ред.ред. код]

Медіаною називають варіанту, що ділить варіаційний ряд на дві частини з рівною кількістю варіант. Якщо кількість варіант непарна (n = 2k + 1), то \tilde{x} = x_{k+1}, у випадку парної кількості варіант (n = 2k), медіана дорівнює:[10]

\tilde{x} = \frac{(x_k + x_{k+1})}{2}.

Наприклад, для ряду 2 3 5 6 7 медіана дорівнює 5; для ряду 2 3 5 6 7 9 медіана дорівнює (5 + 6)/2 = 5.5.

Медіана, як об'єктивний оцінювач[ред.ред. код]

Гаус зауважив, що будь-який об'єктивний оцінювач мінімізує ризик (очікувану втрату) відносно функції помилкової втрати. На думку Лапласа, медіана, як об'єктивний оцінювач мінімізує ризик відносно функції втрати абсолютного відхилення. Інші функції втрати застосовують в статистичній теорії, особливо при перевірці статистичної надійності. Теорію об'єктивного оцінювача, започаткував Джордж Браун в 1947 році[11].

Оцінка одного розмірного параметра θ, буде об'єктивним оцінювачем для медіани, якщо, для сталої θ, медіана поширення оцінки знаходиться в значенні θ , тобто, відхилення трапляються не так часто.

Подальші властивості медіани, як об'єктивного оцінювача були досліджені[12][13][14][15]. Зокрема, медіана, як об'єктивний оцінювач існує у випадках, де не можливо максимуму вірогідності. Медіани, як об'єктивні оцінювачі інваріантні під один-до-одного, перетвореннями.

Примітки[ред.ред. код]

  1. а б Социологический энциклопедический словарь / Ред.-координатор Г. В. Осипов.-М., 1998
  2. Медіана — Розум.org.ua
  3. а б Козлов М. В., Прохоров А. В. (1987). Введение в математическую статистику. Изд-во МГУ. 
  4. а б Кремер Н. Ш. (2004). Теория вероятностей и математическая статистика. Юнити. ISBN 5-238-00573-3. 
  5. Stigler, S. M. (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. ISBN 0674403401.
  6. Jaynes, E.T. (2007). Probability theory: the logic of science (5. print. ed.). Cambridge [u.a.]: Cambridge Univ. Press. p. 172. ISBN 978-0-521-59271-0.
  7. Laplace PS de (1818) Deuxième supplément à la Théorie Analytique des Probabilités, Paris, Courcier.
  8. а б Keynes, J.M. (1921) A Treatise on Probability. Pt II Ch XVII § 5 (p 201) (2006 reprint, Cosimo Classics, ISBN 9781596055308 : multiple other reprints).
  9. Galton F (1881) «Report of the Anthropometric Committee» pp 245–260. Report of the 51st Meeting of the British Association for the Advancement of Science.
  10. Гмурман В. Е. (2003). Теория вероятностей и математическая статистика (вид. 9-те). Высшая школа. 
  11. Brown, George W. (1947). «On Small-Sample Estimation». Annals of Mathematical Statistics 18 (4): 582–585. doi:10.1214/aoms/1177730349. JSTOR 2236236.
  12. Lehmann, Erich L. (1951). «A General Concept of Unbiasedness». Annals of Mathematical Statistics 22 (4): 587–592. doi:10.1214/aoms/1177729549.JSTOR 2236928.
  13. Birnbaum, Allan (1961). «A Unified Theory of Estimation, I». Annals of Mathematical Statistics 32 (1): 112–135. doi:10.1214/aoms/1177705145. JSTOR 2237612.
  14. van der Vaart, H. Robert (1961). «Some Extensions of the Idea of Bias». Annals of Mathematical Statistics 32 (2): 436–447. doi:10.1214/aoms/1177705051.JSTOR 2237754. MR 125674.
  15. Pfanzagl, Johann; with the assistance of R. Hamböker (1994). Parametric Statistical Theory. Walter de Gruyter. ISBN 3-11-013863-8. MR 1291393.

Див. також[ред.ред. код]

Посилання[ред.ред. код]


Сигма Це незавершена стаття з математики.
Ви можете допомогти проекту, виправивши або дописавши її.