6.2 Sesgo, varianza y error cuadrático medio

6.2.1 Sesgo

Mediante cálculos sencillos puede obtenerse el sesgo del estimador de Parzen-Rosenblatt: Sesgo(ˆfh(x))=E(ˆfh(x))f(x)=1hK(xyh)f(y)dyf(x)=(Khf)(x)f(x), siendo el operador convolución: (fg)(x)=f(xy)g(y)dy. A partir de la expresión del sesgo puede obtenerse otra asintótica para el mismo: E(ˆfh(x))f(x)=dK2h2f(x)+O(h4),con dK=t2K(t)dt.

6.2.2 Varianza

La varianza puede tratarse análogamente: Var(ˆfh(x))=1nh2Var(K(xX1h))=1nh2[K(xyh)2f(y)dy(K(xyh)f(y)dy)2]=1n[((Kh)2f)(x)((Khf)(x))2]=1nh[(K2)hf](x)1n[(Khf)(x)]2.Su expresión asintótica resulta: Var(ˆfh(x))=cKnhf(x)1nf(x)2+O(hn), con cK=K(t)2dt.

6.2.3 Error cuadrático medio

Como consecuencia el error cuadrático medio del estimador es: MSE(ˆfh(x))= E(ˆfh(x)f(x))2=Sesgo(ˆfh(x))2+Var(ˆfh(x))= [(Khf)(x)f(x)]2+1nh[(K2)hf](x)1n[(Khf)(x)]2. Además, su expresión asintótica es:MSE(ˆfh(x))=d2K4h4f(x)2+cKnhf(x)1nf(x)2+O(h6)+O(hn).

6.2.4 Error cuadrático medio integrado (MISE)

Una medida global (no para un x particular) del error cometido por el estimador es el error cuadrático medio integrado: MISE(ˆfh(x))=E[(ˆfh(x)f(x))2]dx=MSE(ˆfh(x))dx=[(Khf)(x)f(x)]2dx+cKnh1n[(Khf)(x)]2dx. Una expresión asintótica para el mismo es la siguiente: MISE(ˆfh(x))= d2K4h4f(x)2dx+cKnh1nf(x)2dx+O(h6)+O(hn). En ella se puede ver el efecto negativo de tomar ventanas (h) demasiado grandes o demasiado pequeñas.