Ядрова оцінка густини розподілу

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Ядрова оцінка густини розподілу ста нормально розподілених випадкових чисел з використанням різних параметрів згладжування.

В статистиці, я́дрова оці́нка густини́ розпо́ділу (англ. Kernel density estimation) — це непараметричний метод оцінки функції густини випадкової величини за вибіркою. Ядрова оцінка густини є важливою задачею згаладжування даних; при застосуванні методу судження щодо статистичних властивостей популяції здійснюється на базі скінченної вибірки. В деяких галузях (таких як обробка сигналів, економетрика) поряд з ядровою оцінкою густини використовують назву вікно Парцель-Розенблата, на честь Емануеля Парцена[en] та Мюрея Розенблата[en], котрі незалежно один від одного створили метод в теперішньому його вигляді.[1][2]

Визначення[ред.ред. код]

Нехай (x1, x2, …, xn) — вибірка н.о.р.в.в., отримана з деякого розподілу з невідомою густиною ƒ. Потрібно оцінити форму цієї функції ƒ. Ядрова оцінка цієї густини ƒ задається формулою

де K(·) — статистичне ядро — симетрична, але не обов'язково додатня функція з інтегралом рівним одиниці, h > 0 — параметр згладжування, який ще називають пропускно́ю зда́тністю.

Практичне обчислення параметру згладжування[ред.ред. код]

Якщо використовується гаусівські ядрові функції для оцінки одновимірних даних і оцінювана базова густина є стандартною нормальною, тоді можна показати, що оптимальним значенням параметру згладжування, h, є

, де  — стандартне відхилення вибірки, що оцінюється.

Таке наближення називається нормально розподілене наближення (або гаусівське наближення).

Джерела[ред.ред. код]

  1. Rosenblatt, M. (1956). Remarks on some nonparametric estimates of a density function. Annals of Mathematical Statistics 27. с. 832–837. doi:10.1214/aoms/1177728190.  (англ.)
  2. Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics 33. с. 1065–1076. doi:10.1214/aoms/1177704472.  (англ.)


Статистика Це незавершена стаття зі статистики.
Ви можете допомогти проекту, виправивши або дописавши її.