1.1 El lenguaje y entorno estadístico R
R
es un lenguaje de programación desarrollado específicamente para el
análisis estadístico y la visualización de datos.
El lenguaje
R
es interpretado (similar a Matlab o Phyton) pero orientado al análisis estadístico (fórmulas modelos, factores,…).- derivado del S (Laboratorios Bell).
R
es un Software Libre bajo las condiciones de licencia GPL de GNU, con código fuente de libre acceso.- Además de permitir crear nuevas funciones, se pueden examinar y modificar las ya existentes.
Multiplataforma, disponible para los sistemas operativos más populares (Linux, Windows, MacOS X, …).
1.1.1 Principales características
Se pueden destacar las siguientes características del entorno R
:
Dispone de numerosos complementos (librerías, paquetes) que cubren “literalmente” todos los campos del análisis de datos.
Repositorios:
CRAN (9705, 14972, 19122, …)
Bioconductor (1289, 1741, 2183, …),
GitHub, …
Existe una comunidad de usuarios (programadores) muy dinámica (multitud de paquetes adicionales).
Muy bien documentado y con numerosos foros de ayuda.
Puntos débiles (a priori): velocidad, memoria, …
Aunque inicialmente fue un lenguaje desarrollado por estadísticos para estadísticos:
Hoy en día es muy popular:
R
destaca especialmente en:
Representaciones gráficas.
Métodos estadísticos “avanzados”:
Data Science: Statistical Learning, Data Mining, Machine Learning, Business Intelligence, …
Datos funcionales.
Estadística espacial.
…
Análisis de datos “complejos”:
Big Data.
Lenguaje natural (Text Mining).
Análisis de redes.
…
En el Apéndice A se detallan los pasos para la instalación de R
y el entorno de desarrollo RStudio.
En la Sección Enlaces de las Referencias se incluyen recursos adicionales, incluyendo algunos que pueden ser útiles para el aprendizaje de R.