¡Ya hay datos abiertos de COVID-19 en México!

Por

1 minuto, 56 segundos

La Secretaría de Salud publicó los datos sobre COVID-19 en formato abierto el 13 de abril. Una revisión de la base de datos revela los campos que todavía pueden ser agregados a este conjunto de datos para mejorar los análisis realizados con ella. 

El lunes 13 de abril, la Secretaría de Salud de México (SSa) publicó por primera vez una base de datos sobre los casos de COVID19 en formato abierto. Serendipia hizo una revisión de este conjunto de datos para identificar las diferencias entre este archivo y las tablas de casos positivos y sospechosos que había publicado la dependencia hasta hace algunos días. 

A continuación, los principales puntos a considerar sobre este base de datos abiertos: 

A FAVOR

  • Está en formato csv

A diferencia de las tablas en formato PDF, esta base permite utilizar los datos. Un archivo en formato csv puede ser abierto en programas como Excel, pero también en softwares gratuitos para analizar datos como R o lenguajes de programación como Python. Esto hace posible hacer análisis y visualizaciones con la información. 

  • Tiene un diccionario de datos

La SSa publicó un diccionario de datos con esta base que es posible descargar en el mismo enlace en el que está disponible la base. Se trata de una carpeta que contiene dos archivos: el catálogo y los descriptores. Los descriptores explican las variables que contiene la base de datos y el formato en el que están estructurados, mientras que el catálogo presenta el significado de cada clave utilizada en la base de datos. 

  • Incluye información que antes no estaba disponible en formato abierto

Esta base de datos presenta algunas de las variables que en las tablas de casos positivos y sospechosos no estaban disponibles: el municipio de residencia de la persona, el tipo de paciente (ambulatorio u hospitalizado), las comorbilidades y la fecha de defunción (en el caso de los pacientes que murieron). 

  • Permite hacer mapas 

Las claves de entidades y municipios (del INEGI) permiten que el proceso para generar mapas con lenguajes de programación y análisis de datos. 

  • Están corrigiendo los errores

El lunes 13 de abril, en la base de datos había dos campos de hombres cuyo valor en el campo “embarazo” era positivo. Este error fue señalado en redes sociales y al día siguiente, había sido corregido por la dependencia federal.

  • Está publicada en datos.gob.mx

Hay una persona responsable de contacto, hay un registro de actualización, tiene una licencia de libre uso. Qué mas indica

  • Integra positivos, negativos y en proceso

A diferencia de las tablas del Comunicado Técnico Diario, esta base de datos abiertos integra todos los resultados de las pruebas que han sido realizadas: positivos, negativos y en proceso. Esto resulta en una base de datos mucho más completa y que permite mejores análisis.

A MEJORAR

Después de revisar esta base de datos, Serendipia considera que la SSa podría agregar los siguientes campos para enriquecer la información y mejorar los análisis realizados con ella:

  • Fecha de alta
  • Municipio de diagnóstico
  • Fecha en la que se reciben los resultados de la prueba para COVID-19
  • ID único en cada registro
  • Fecha de registro de cada campo: distinguir fecha de publicación, fecha de actualización y fecha de creación del registro
  • Municipio de hospitalización

Serendipia es una iniciativa independiente de periodismo de datos. Puedes apoyarnos compartiendo nuestras notas, suscribiéndote en YouTube o ayudarnos de otras maneras .

Comentarios

5 comentarios en la nota: ¡Ya hay datos abiertos de COVID-19 en México!


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


  1. Pablo Galicia dice:

    Hola,

    Pudieran publicar la base que en teoria se puede descargar de la página de datos abiertos? Llevo varios días intentando descargarla y no he podido ya que me marca error de time out.