6.2 Sesgo, varianza y error cuadrático medio

6.2.1 Sesgo

Mediante cálculos sencillos puede obtenerse el sesgo del estimador de Parzen-Rosenblatt: \[\begin{aligned} Sesgo\left( \hat{f}_{h}\left( x \right) \right) &= E\left( \hat{f}_{h}\left( x \right) \right) -f\left( x \right) =\int \frac{1}{h}K\left( \frac{x-y}{h} \right) f\left( y \right) dy-f\left( x \right) \\ &= \left( K_{h}\ast f \right) \left( x \right) -f\left( x \right), \end{aligned}\] siendo \(\ast\) el operador convolución: \[\left( f\ast g \right) \left( x \right) = \int f\left( x-y \right) g\left( y \right) dy.\] A partir de la expresión del sesgo puede obtenerse otra asintótica para el mismo: \[E\left( \hat{f}_{h}\left( x \right) \right) -f\left( x \right) =\frac{d_{K}}{2} h^2f^{\prime \prime }\left( x \right) +O\left( h^{4} \right),\]con \(d_{K}=\int t^2K\left( t \right) dt\).

6.2.2 Varianza

La varianza puede tratarse análogamente: \[\begin{aligned} Var\left( \hat{f}_{h}\left( x \right) \right) &= \frac{1}{nh^2}Var\left( K\left( \frac{x-X_1}{h} \right) \right) \\ &= \frac{1}{nh^2}\left[ \int K\left( \frac{x-y}{h} \right)^2f\left( y \right) dy-\left( \int K\left( \frac{x-y}{h} \right) f\left( y \right) dy \right)^2\right] \\ &= \frac{1}{n}\left[ \left( \left( K_{h} \right)^2\ast f \right) \left( x \right) -\left( \left( K_{h}\ast f \right) \left( x \right) \right)^2 \right] \\ &= \frac{1}{nh}\left[ \left( K^2 \right) _{h}\ast f\right] \left( x \right) - \frac{1}{n}\left[ \left( K_{h}\ast f \right) \left( x \right) \right]^2.\end{aligned}\]Su expresión asintótica resulta: \[Var\left( \hat{f}_{h}\left( x \right) \right) =\frac{c_{K}}{nh}f\left( x \right) - \frac{1}{n}f\left( x \right)^2 + O\left( \frac{h}{n} \right),\] con \(c_{K}=\int K\left( t \right)^2dt\).

6.2.3 Error cuadrático medio

Como consecuencia el error cuadrático medio del estimador es: \[\begin{aligned} MSE\left( \hat{f}_{h}\left( x \right) \right) =&\ E\left( \hat{f}_{h}\left( x \right) -f\left( x \right) \right)^2=Sesgo\left( \hat{f}_{h}\left( x \right) \right)^2+Var\left( \hat{f}_{h}\left( x \right) \right) \\ =&\ \left[ \left( K_{h}\ast f \right) \left( x \right) -f\left( x \right) \right] ^2+\frac{1}{nh}\left[ \left( K^2 \right) _{h}\ast f\right] \left( x \right) \\ &-\frac{1}{n}\left[ \left( K_{h}\ast f \right) \left( x \right) \right]^2. \end{aligned}\] Además, su expresión asintótica es:\[MSE\left( \hat{f}_{h}\left( x \right) \right) =\frac{d_{K}^2}{4} h^{4}f^{\prime \prime }\left( x \right)^2+\frac{c_{K}}{nh}f\left( x \right) -\frac{1}{n}f\left( x \right)^2+O\left( h^{6} \right) +O\left( \frac{h}{n} \right).\]

6.2.4 Error cuadrático medio integrado (MISE)

Una medida global (no para un \(x\) particular) del error cometido por el estimador es el error cuadrático medio integrado: \[\begin{aligned} & & MISE\left( \hat{f}_{h}\left( x \right) \right) =\int E\left[ \left( \hat{f} _{h}\left( x \right) -f\left( x \right) \right)^2\right] dx=\int MSE\left( \hat{f}_{h}\left( x \right) \right) dx= \\ &&\int \left[ \left( K_{h}\ast f \right) \left( x \right) -f\left( x \right) \right]^2dx+\frac{c_{K}}{nh}-\frac{1}{n}\int \left[ \left( K_{h}\ast f \right) \left( x \right) \right]^2dx. \end{aligned}\] Una expresión asintótica para el mismo es la siguiente: \[\begin{aligned} MISE\left( \hat{f}_{h}\left( x \right) \right) =&\ \frac{d_{K}^2}{4}h^4\int f^{\prime \prime }\left( x \right)^2dx+\frac{c_{K}}{nh}-\frac{1}{n}\int f\left( x \right)^2dx \\ &+O\left( h^{6} \right) +O \left( \frac{h}{n} \right). \end{aligned}\] En ella se puede ver el efecto negativo de tomar ventanas (\(h\)) demasiado grandes o demasiado pequeñas.