COVID-19

Datos oficiales de COVID-19 en España

El objetivo principal de este repositorio es facilitar el acceso a los datos oficiales del COVID-19 en España a los que pueden estar interesados en analizarlos empleando R. Además se incluye una pequeña recopilación de enlaces a recursos que pueden ser de interés.

Esta es la nueva versión del repositorio, con datos actualizados a fecha 2022-01-12. La versión anterior dejó de actualizarse el 2020-05-21 por problemas con la fuente de datos, aunque todavía es posible acceder a ella a través de este enlace (puede resultar de interés como histórico y para obtener información sobre los problemas que hubo con los datos).

En esta versión se emplean los datos oficiales disponibles en la pestaña Documentación y Datos de la web Situación de COVID-19 en España (aplicación shiny) del Instituto de Salud Carlos III (ISCIII). Se considera únicamente el archivo:

Los datos publicados proceden de la declaración individualizada de casos COVID-19 a la Red Nacional de Vigilancia Epidemiológica (RENAVE) a través de la aplicación informática SiViEs y se están actualizando de forma continua. Además de que pueden contener errores, hay un retraso al ir añadiendo los nuevos casos en las fechas de diagnóstico1. Por este motivo los valores correspondientes a las últimas fechas no están consolidados y no deberían ser empleados en los análisis (salvo que se corrijan). Lamentablemente en el caso de algunas CCAA también se están haciendo cambios en los valores reportados en fechas muy anteriores (llaman especialmente la atención los cambios en las series de Madrid y Cataluña; ver histórico).

Archivos

En COVID-19-tablas.html se pueden consultar tablas con los datos actuales por CCAA (informe generado automáticamente a partir de COVID-19-tablas.Rmd). Además, en la pestaña Gráficos de la web https://covid19.citic.udc.es/ se pueden consultar gráficos dinámicos y tablas adicionales.

El archivo COVID-19-actualizar.R contiene el código necesario para descargar e importar los datos a R.

En el directorio acumula2_hist2 se están almacenando un histórico de los datos publicados el ISCIII (reportados por las CCAA). Puede ser de utilidad para estudiar como se van consolidando los datos de la serie. Por ejemplo se incluye un informe con la evolución de los datos reportados por las distintas CCAA (en la web https://covid19.citic.udc.es/ se pueden consultar gráficos dinámicos seleccionando Cambios en los valores reportados:2021 en la pestaña Predicción cooperativa: Información). Es muy triste constatar que después de tanto tiempo todavía siguen los problemas (algunas CCAA están tardando más de 6 semanas en consolidar los datos; otras como Madrid o Cataluña hicieron cambios drásticos en las series reportadas…).

NOTAS

Cambios a partir del 2021-03-02:

Proyecto de predicción cooperativa

Otro objetivo de este repositorio es proporcionar datos que puedan servir como base para el llamamiento del Comité Español de Matemáticas para la creación de un predictor cooperativo.

El proyecto “Predicción Cooperativa” surgió dentro de la iniciativa “Matemáticas contra el coronavirus” impulsada por el Comité Español de Matemáticas (CEMat). Como resultado, se desarrolló un sitio web interactivo utilizando R (https://covid19.citic.udc.es) para monitorear y predecir a corto plazo variables relevantes en la propagación del Covid-19. Esta web proporcionaba “predicciones cooperativas” (metapredicciones), en horizontes de 1 a 7 días por cada comunidad autónoma y variable de interés, combinando predicciones basadas en diferentes métodos que regularmente suministraban un gran número de grupos de investigación de forma independiente y altruista. Para más detalles ver Vilar-Fernández et al. (2020).

El proyecto inicial estuvo vigente desde el 2 de abril hasta el 26 de mayo de 2020, ya que la falta de datos oficiales obligó a su paralización. En enero de 2021 volvieron a publicarse los datos y poco después el proyecto Cooperative Forecasting (ForeCoop) logró financiación del Fondo Supera COVID-19 para continuar el desarrollo de la web https://covid19.citic.udc.es y continuar proporcionando predicciones cooperativas (desde el 8 de abril hasta el 7 de octubre de 2021).

El código principal, empleado durante el primer periodo del proyecto para el cálculo de las predicciones cooperativas y la generación de informes, está disponible en el directorio prediccion_cooperativa. El archivo historico_cp.RData en esta carpeta contiene las predicciones cooperativas obtenidas durante el primer periodo del proyecto (un compromiso de confidencialidad impide proporcionar las predicciones individuales de los grupos participantes).

El directorio acumula2_hist contiene el código necesario para generar el histórico de valores reportados del ISCIII durante el primer periodo del proyecto: acumula2_hist.RData, empleado para la evaluación de los predictores. También incluye un informe con más detalles (puede servir también para ver algunos de los problemas de los datos reportados por las distintas CCAA en el pasado, pocas se salvan…).

Enlaces

Datos

Predicción cooperativa

COVID-19 y R

Epidemiología (y áreas relacionadas) con R

Paquetes de R

Paquetes y otras herramientas…

Se puede realizar una búsqueda en https://rseek.org

Colabora

Si quieres puedes ayudar a través de GitHub o enviando un correo a rubenfcasal@gmail.com.


1: Casos: En los casos anteriores al 11 de mayo, se utiliza la fecha de diagnóstico, en su ausencia la fecha de declaración a la comunidad y, en su ausencia, la fecha clave (fecha usada para estadísticas por las CCAA). En los casos posteriores al 10 de mayo, en ausencia de fecha de diagnóstico se utiliza la fecha clave.

Hospitalizaciones, ingresos en UCI, defunciones: los casos hospitalizados están representados por fecha de hospitalización (en su defecto, la fecha de diagnóstico, y en su defecto la fecha clave, los casos UCI por fecha de admisión en UCI (en su defecto, la fecha de diagnóstico, y en su defecto la fecha clave) y las defunciones por fecha de defunción (en su defecto, la fecha de diagnóstico, y en su defecto la fecha clave).

Fecha Clave: se recomendó a las comunidades autónomas definir la fecha Clave como la fecha de inicio de síntomas y en su ausencia la fecha de declaración a la CCAA, hasta 10 de mayo. Desde el 11 de mayo en adelante la fecha Clave es la más precoz de entre las fechas de consulta o de diagnóstico. Ocasionalmente se puede sustituir por la fecha de toma de muestras.