6.2 Sesgo, varianza y error cuadrático medio
6.2.1 Sesgo
Mediante cálculos sencillos puede obtenerse el sesgo del estimador de Parzen-Rosenblatt: Sesgo(ˆfh(x))=E(ˆfh(x))−f(x)=∫1hK(x−yh)f(y)dy−f(x)=(Kh∗f)(x)−f(x), siendo ∗ el operador convolución: (f∗g)(x)=∫f(x−y)g(y)dy. A partir de la expresión del sesgo puede obtenerse otra asintótica para el mismo: E(ˆfh(x))−f(x)=dK2h2f′′(x)+O(h4),con dK=∫t2K(t)dt.
6.2.2 Varianza
La varianza puede tratarse análogamente: Var(ˆfh(x))=1nh2Var(K(x−X1h))=1nh2[∫K(x−yh)2f(y)dy−(∫K(x−yh)f(y)dy)2]=1n[((Kh)2∗f)(x)−((Kh∗f)(x))2]=1nh[(K2)h∗f](x)−1n[(Kh∗f)(x)]2.Su expresión asintótica resulta: Var(ˆfh(x))=cKnhf(x)−1nf(x)2+O(hn), con cK=∫K(t)2dt.
6.2.3 Error cuadrático medio
Como consecuencia el error cuadrático medio del estimador es: MSE(ˆfh(x))= E(ˆfh(x)−f(x))2=Sesgo(ˆfh(x))2+Var(ˆfh(x))= [(Kh∗f)(x)−f(x)]2+1nh[(K2)h∗f](x)−1n[(Kh∗f)(x)]2. Además, su expresión asintótica es:MSE(ˆfh(x))=d2K4h4f′′(x)2+cKnhf(x)−1nf(x)2+O(h6)+O(hn).
6.2.4 Error cuadrático medio integrado (MISE)
Una medida global (no para un x particular) del error cometido por el estimador es el error cuadrático medio integrado: MISE(ˆfh(x))=∫E[(ˆfh(x)−f(x))2]dx=∫MSE(ˆfh(x))dx=∫[(Kh∗f)(x)−f(x)]2dx+cKnh−1n∫[(Kh∗f)(x)]2dx. Una expresión asintótica para el mismo es la siguiente: MISE(ˆfh(x))= d2K4h4∫f′′(x)2dx+cKnh−1n∫f(x)2dx+O(h6)+O(hn). En ella se puede ver el efecto negativo de tomar ventanas (h) demasiado grandes o demasiado pequeñas.