Capítulo 4 Manipulación de datos

El punto de partida para (casi) cualquier estudio estadístico son los datos.

“In God we trust, all others must bring data.”

“Without data, you’re just another person with an opinion.”

— W. E. Deming

Como ya se comentó anteriormente, el objeto de R en el que se suele almacenar un conjunto de datos es el data.frame (ver Sección 2.3). En este capítulo se muestran las herramientas básicas disponibles en el paquete base de R para la manipulación de conjuntos de datos. Otras alternativas más avanzadas pero que pueden resultar de gran interés son las que proporcionan las librerías tidyverse (ver Apéndice) o data.table, aunque pueden requerir de cierto tiempo de aprendizaje y no serían muy recomendables para usuarios que se están iniciando en R.

Como también se mostró en capítulos anteriores, podemos crear conjuntos de datos mediante código (Sección 2.3) o cargar bases de datos disponibles en librerías de R con el comando data() (Sección 1.8.2). Sin embargo, normalmente importaremos los datos de un archivo externo.