1.1 El lenguaje y entorno estadístico R

R es un lenguaje de programación desarrollado específicamente para el análisis estadístico y la visualización de datos.

  • El lenguaje R es interpretado (similar a Matlab o Phyton) pero orientado al análisis estadístico (fórmulas modelos, factores,…).

    • derivado del S (Laboratorios Bell).
  • R es un Software Libre bajo las condiciones de licencia GPL de GNU, con código fuente de libre acceso.

    • Además de permitir crear nuevas funciones, se pueden examinar y modificar las ya existentes.
  • Multiplataforma, disponible para los sistemas operativos más populares (Linux, Windows, MacOS X, …).

1.1.1 Principales características

Se pueden destacar las siguientes características del entorno R:

  • Dispone de numerosos complementos (librerías, paquetes) que cubren “literalmente” todos los campos del análisis de datos.

  • Repositorios:

  • Existe una comunidad de usuarios (programadores) muy dinámica (multitud de paquetes adicionales).

  • Muy bien documentado y con numerosos foros de ayuda.

  • Puntos débiles (a priori): velocidad, memoria, …

Aunque inicialmente fue un lenguaje desarrollado por estadísticos para estadísticos:

Rexer Data Miner Survey 2007-2015

Figura 1.2: Rexer Data Miner Survey 2007-2015

Hoy en día es muy popular:

[IEEE Spectrum](https://spectrum.ieee.org) Top Programming Languages, 2019

Figura 1.3: IEEE Spectrum Top Programming Languages, 2019

R destaca especialmente en:

  • Representaciones gráficas.

  • Métodos estadísticos “avanzados”:

    • Data Science: Statistical Learning, Data Mining, Machine Learning, Business Intelligence, …

    • Datos funcionales.

    • Estadística espacial.

  • Análisis de datos “complejos”:

    • Big Data.

    • Lenguaje natural (Text Mining).

    • Análisis de redes.

En el Apéndice A se detallan los pasos para la instalación de R y el entorno de desarrollo RStudio. En la Sección Enlaces de las Referencias se incluyen recursos adicionales, incluyendo algunos que pueden ser útiles para el aprendizaje de R.