Ядерна оцінка щільності розподілу

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Ядерна оцінка щільності розподілу ста нормально розподілених випадкових чисел з використанням різних параметрів згладжування.

В статистиці, ядерна оцінка щільності розподілу (англ. Kernel density estimation) — це непараметричний метод оцінки функції щільності випадкової величини за вибіркою. Ядерна оцінка щільності є важливою задачею згаладжування даних; при застосуванні методу судження щодо статистичних властивостей популяції здійснюється на базі скінченної вибірки. В деяких галузях (таких як обробка сигналів, економетрика) поряд з ядерною оцінкою щільності використовують назву Вікно Парцель-Розенблата, на честь Емануеля Парцена та Мюрея Розенблата котрі незалежно один від одного створили метод в теперішній його формі[1][2].

Визначення[ред.ред. код]

Нехай (x1, x2, …, xn) — вибірка н.о.р.в.в. отримана з деякого розподілу з невідомою щільністю ƒ. Потрібно оцінити форму цієї функції ƒ. Ядерна оцінка цієї щільності ƒ задається формулою


    \hat{f}_h(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big),

де K(·) — статистичне ядро — симетрична, але не обов'язково додатня функція з інтегралом рівним одиниці, h > 0 — параметр згладжування, який ще називають пропускною здатністю.

Практичне обчислення параметру згладжування[ред.ред. код]

Якщо використовується гаусівські ядрові функції для оцінки одновимірних даних і оцінювана базова щільність є стандартною нормальною, тоді можна показати, що оптимальним значенням параметру згладжування, h, є

h = \left(\frac{4\hat{\sigma}^5}{3n}\right)^{\frac{1}{5}} \approx 1.06 \hat{\sigma} n^{1/5}, де \hat{\sigma}стандартне відхилення вибірки, що оцінюється.

Таке наближення називається нормально розподілене наближення (або гаусівське наближення).

Джерела[ред.ред. код]

  1. Rosenblatt, M. (1956). «Remarks on some nonparametric estimates of a density function». Annals of Mathematical Statistics 27. с. 832–837. doi:10.1214/aoms/1177728190.  (англ.)
  2. Parzen, E. (1962). «On estimation of a probability density function and mode». Annals of Mathematical Statistics 33. с. 1065–1076. doi:10.1214/aoms/1177704472.  (англ.)