Prólogo
En los últimos años, la ciencia de datos está experimentando una creciente importancia y popularidad, tanto en el ámbito académico como empresarial. Se trata de una disciplina que integra herramientas estadísticas e informáticas para la toma de decisiones, a partir del análisis de datos. Especialmente importante es el modelado predictivo de datos, que permite analizar conjuntos complejos de datos para aprender de ellos y realizar predicciones, empleando métodos de regresión y clasificación.
Este es un libro de análisis computacional de datos utilizando el lenguaje de programación y entorno estadístico R
, escrito con el objetivo de introducir las técnicas más importantes del aprendizaje estadístico para el modelado predictivo.
El enfoque es eminentemente práctico, presentando la teoría necesaria para describir los métodos, pero prestando especial énfasis en el código, al considerar que este puede ayudar a entender mejor el funcionamiento de los métodos, además de resultar imprescindible en la resolución de problemas reales.
El presente libro está destinado a lectores con distintos perfiles. Puede resultar de utilidad tanto a alumnos de los últimos cursos de grados, y de másteres, con un fuerte componente tecnológico, como a profesionales del sector de la ciencia de datos. Se asume que el lector posee los conocimientos que se adquieren en una primera asignatura de estadística de un grado universitario. En concreto, nociones de probabilidad, incluyendo el teorema de Bayes y variables aleatorias, simulación (ver p. ej. Cao Abad et al., 2001; Dalpiaz, 2022; y Sección 1.3 de Fernández-Casal et al., 2023), y los métodos clásicos de análisis de datos (estadística descriptiva e inferencia). Es especialmente importante que el lector esté familiarizado con la regresión simple, lineal y polinómica, y sería deseable, aunque no imprescindible, que disponga de nociones básicas de regresión múltiple.
Este libro se desarrolló inicialmente como apuntes de la asignatura de Aprendizaje Estadístico del Máster en Técnicas Estadísticas (MTE), organizado conjuntamente por las tres universidades gallegas (Universidade da Coruña, Universidade de Santiago de Compostela y Universidade de Vigo).