Organización

En el Capítulo 1 se pretende dar una visión general, cubriendo todas las etapas del proceso e introduciendo los conceptos básicos y la notación. El Capítulo 2 es una revisión de los métodos clásicos de regresión y clasificación, desde el punto de vista del aprendizaje estadístico. Los lectores que ya dispongan de conocimientos previos pueden centrarse en las diferencias con la aproximación tradicional. Si se tienen dudas sobre alguno de los conceptos utilizados, se puede revisar alguna de las referencias introductorias que se citan en el texto. Este capítulo se centra principalmente en regresión lineal múltiple, aunque también se introducen, de forma más superficial, los principales métodos tradicionales de clasificación.

El resto del libro presenta dos partes diferenciadas. Se decidió comenzar por los conceptos que pueden resultar novedosos para un estudiante de estadística, al estar más relacionados con el campo informático: métodos basados en árboles (capítulos 3, Árboles de decisión, y 4, Bagging y boosting) y Máquinas de soporte vectorial (Capítulo 5). En la práctica, estos métodos se usan principalmente para clasificación supervisada.

La segunda parte, capítulos 6 (Métodos de regularización y reducción de la dimensión), 7 (Regresión no paramétrica) y 8 (Redes neuronales), se centra principalmente en regresión, aunque este tipo de métodos también se usan para problemas de clasificación. Realmente, a lo largo de todo el libro se van intercalando conceptos de regresión y de clasificación.

Por supuesto, se podría cambiar el orden de los contenidos para adaptarlos a distintos perfiles de lectores3. Por ejemplo, los contenidos del Capítulo 6 se podrían tratar justo después del Capítulo 2, aunque nosotros no los consideramos métodos clásicos (de momento), principalmente porque no son muy conocidos en algunos campos.


  1. Un lector podría preferir saltarse el Capítulo 2 y verlo inmediatamente antes del Capítulo 6, tal vez comenzando por la Sección 2.3 (Capítulo 1 - Capítulo 3 - Capítulo 4 - Capítulo 5 - Sección 2.3 - Sección 2.1 - Sección 2.2 - Capítulo 6 - Capítulo 7 - Capítulo 8; esta es la ordenación que se siguió en las primeras versiones de este libro). Alternativamente, podría pasar de la Sección 2.1 directamente al Capítulo 6 y dejar para el final la parte de clasificación (Capítulo 1 - Sección 2.1 - Capítulo 6 - Capítulo 7 - Capítulo 8 - Sección 2.2 - Sección 2.3 - Capítulo 3 - Capítulo 4 - Capítulo 5).↩︎