6.1 Estimación no paramétrica de la función de densidad
Como ya se introdujo en la Sección 3.3, si \(\left( X_1, X_2, \ldots, X_n \right)\) es una muestra aleatoria simple (m.a.s.),, de una población con función de distribución \(F\), absolutamente continua, y función de densidad \(f\), el estimador tipo núcleo propuesto por Parzen (1962) y Rosenblatt (1956) viene dado por \[\hat{f}_{h}\left( x \right) =\frac{1}{nh}\sum_{i=1}^{n}K\left( \frac{x-X_i}{ h} \right) =\frac{1}{n}\sum_{i=1}^{n}K_{h}\left( x-X_i \right),\] donde \(K_{h}\left( u \right) =\frac{1}{h}K\left( \frac{u}{h} \right)\), \(K\) es una función núcleo (normalmente una densidad simétrica en torno al cero) y \(h>0\) es una parámetro de suavizado, llamado ventana, que regula el tamaño del entorno que se usa para llevar a cabo la estimación. Es habitual exigir que la función núcleo \(K\) sea no negativa y su integral sea uno: \[K\left( u \right) \geq 0,~\forall u,~\int_{-\infty }^{\infty } K\left( u \right) du=1.\] Además también es frecuente exigir que \(K\) sea una función simétrica (\(K\left( -u \right) =K\left( u \right)\)).