2.1 Tipos de datos espaciales

En el campo de los datos espaciales se suele distinguir entre dos tipos de datos:

  • Datos vectoriales: en los que se emplean coordenadas para definir las posiciones espaciales “exactas” de los datos. Entre ellos estarían los asociados a las geometrías habituales: puntos, líneas, polígonos y rejillas.

  • Datos ráster: se utilizan habitualmente para representar una superficie continua. Un ráster no es más que una rejilla regular que determina un conjunto de rectángulos denominados celdas (o píxeles en el análisis de imágenes de satélite y teledetección) que tienen asociados uno o más valores. Este tipo de datos también se denominan arrays o data cubes espaciales (o espacio-temporales). El valor de una celda ráster suele ser el valor medio (o el total) de una variable en el área que representa (se trataría de observaciones de un proceso agregado, descritos en la Sección 1.3.3), aunque en algunos casos es el valor puntual correspondiente al centro de la celda (nodo de una rejilla vectorial).

En este libro entenderemos que ráster hace referencia a agregaciones espaciales y nos centraremos principalmente en datos vectoriales (incluyendo rejillas de datos), aunque hoy en día cada vez es más habitual disponer de datos ráster gracias a la fotografía aérea y a la teledetección por satélite. Como se comentó en la Sección 1.3.3, muchos métodos geoestadísticos admiten datos en distintos soportes (por ejemplo el block kriging descrito en la Sección 4.7.1), aunque combinar datos en diferentes soportes puede presentar en la práctica serias dificultades (para más detalles ver referencias al final de la Sección 1.3.3).

Como ya se comentó en la Sección 1.1, dependiendo de las suposiciones sobre el soporte del proceso (índice espacial) se distingue entre distintos tipos de procesos espaciales. Sin embargo, aunque en principio los objetivos pueden ser muy distintos, en todos estos casos se trabaja con datos similares (espaciales y espacio-temporales):

  • Procesos geoestadísticos (índice espacial continuo):

    • Datos: coordenadas y valores observados (puntos y datos), opcionalmente se pueden considerar los límites de una región de observación o de múltiples regiones (polígonos).

    • Resultados: superficie de predicción (rejilla), opcionalmente predicciones por área (polígonos y datos, o raster).

  • Procesos reticulares/regionales (índice espacial discreto):

    • Datos: límites de regiones y valores asociados (polígonos y datos, , o raster).

    • Resultados: estimaciones por área (polígonos y datos, o raster).

  • Procesos puntuales (indice espacial aleatorio):

    • Datos: coordenadas (puntos), opcionalmente con valores asociados (procesos marcados; puntos y datos), límites región de observación (polígonos).

    • Resultados: superficie de incidencia o probabilidad (rejilla).

Este es el principal motivo de que se hayan desarrollado paquetes de R para facilitar su manipulación (y permitiendo el intercambio de datos entre herramientas). Entre ellos destacan:

  • sp (Classes and methods for spatial data, E. J. Pebesma y Bivand, 2005): se corresponde con Bivand et al. (2013) y emplea clases S4. Se complementa con los paquetes rgdal (interfaz a la geospatial data abstraction library, para la lectura y escritura de datos espaciales) y rgeos (interfaz a la librería Geometry Engine Open Source, para operaciones geométricas).

  • sf (Simple Features for R, E. Pebesma, 2018): alternativa en desarrollo con objetos más simples S3 (compatible con tidyverse y que proporciona una interfaz directa a las librerías GDAL y GEOS) que aspira a reemplazar el paquete sp a corto plazo. Se corresponde con E. Pebesma y Bivand (2021) (disponible online).

El paquete sp tiene un soporte limitado para datos ráster, este es uno de los motivos por los que surgió el paquete raster, que actualmente está siendo reemplazado por el paquete terra (información sobre estos paquetes está disponible en el manual online). El paquete sf no implementa datos ráster (y tiene un soporte muy limitado para rejillas de datos), para manejar este tipo de datos se complementa con el paquete starts (Spatiotemporal Arrays: Raster and Vector Datacubes). Para detalles sobre la conversión entre datos ráster y datos vectoriales ver por ejemplo las secciones 7.5 y 7.7 de E. Pebesma y Bivand (2021).

En este capítulo emplearemos el paquete sf para la manipulación de datos espaciales, aunque en el Apéndice A se incluye una breve introducción a las clases sp, ya que este tipo de objetos siguen siendo ampliamente empleados en la actualidad (y, de momento, algunas de las herramientas disponibles en R solo admiten las clases de datos definidas en este paquete).

References

Bivand, R. S., Pebesma, E., y Gómez-Rubio, V. (2013). Applied Spatial Data Analysis with R (Second). Springer. http://www.asdar-book.org/
Pebesma, E. (2018). Simple Features for R: Standardized Support for Spatial Vector Data. The R Journal, 10(1), 439-446. https://doi.org/10.32614/RJ-2018-009
Pebesma, E., y Bivand, R. (2021). Spatial Data Science. https://keen-swartz-3146c4.netlify.app
Pebesma, E. J., y Bivand, R. S. (2005). Classes and methods for spatial data in R. R News, 5(2), 9-13. https://CRAN.R-project.org/doc/Rnews/