Capítulo 7 Bootstrap y regresión no paramétrica
Por simplicidad nos centraremos en el caso bivariante, el caso multivariante sería análogo. Supongamos que \(\left\{ \left( X_1,Y_1 \right),\left( X_2,Y_2 \right), \ldots, \left( X_n,Y_n \right) \right\}\) es una m.a.s. de una población bidimensional \(\left( X,Y \right)\), con \(E\left( \left\vert Y\right\vert \right) <\infty\), y que el objetivo es realizar inferencias sobre la distribución condicional \(\left. Y \right\vert_{X=x}\), principalmente estimar la función de regresión de \(Y\) dada \(X\): \[m\left( x \right) =E\left( \left. Y\right\vert_{X=x} \right).\]
En esta sección se introducirá la estimación no paramétrica de la función de regresión. En primer lugar se considerará el estimador de Nadaraya-Watson (en la Sección 7.3 se mostrarán generalizaciones de este estimador desde un punto de vista práctico en R). En la siguiente sección se introducirán distintos métodos de remuestreo, diseñados inicialmente para este estimador, y resultados para ellos.