El lunes 13 de abril, la Secretaría de Salud publicó la base de datos sobre casos de COVID-19 en México en formato abierto.

Una noticia pasó desapercibida el lunes 13 de abril durante la conferencia nocturna de la Secretaría de Salud (SSa): la dependencia publicó, por primera vez, la base de datos abiertos de casos de COVID-19 en México.

Aunque la secretaría federal no lo mencionó durante la conferencia de las 7 pm en la que da a conocer el panorama nacional e internacional sobre COVID-19 en México y el mundo, ese día fue la primera vez que esta información estuvo disponible en formato abierto. Los datos están disponibles en un archivo en formato csv (valores separados por comas).

En el sitio oficial de la SSa también es posible descargar el diccionario de datos de esta base, en donde es posible consultar el significado de las claves utilizadas.

Para Serendipia, esta es una buena noticia dentro del contexto de la pandemia de COVID-19 que merece ser celebrada. Tener datos abiertos garantiza el derecho de acceso a la información pública de todas y todos los ciudadanos mexicanos y permite que periodistas, académicos, científicos y cualquier persona que desee hacerlo, explore estos datos y cree innovaciones o conocimiento a partir de ellos.

Además, tener datos sobre casos de COVID-19 en formato abierto implica que las diapositivas presentadas en las conferencias nocturnas de la SSa no serán la única fuente de información para los ciudadanos mexicanos, lo cual es esencial en cualquier democracia: poder contrastar la información oficial con análisis independientes.

Los datos sobre COVID-19 en México

El 27 de marzo, Serendipia publicó un video y una nota en los cuales son señaladas las inconsistencias existentes en la tablas que la SSa publica de manera diaria en su sitio web: estaban en formato PDF, el nivel de desagregación era estatal y no municipal, los datos de las tablas no correspondían a la información presentada en las conferencias diarias, entre otros.

Después, el 6 de abril, la SSa cambió el formato y el contenido de sus tablas, lo cual significó, al menos, las siguientes irregularidades:

  • El contenido de la columna “sexo” cambió de M y F a Masculino y Femenino
  • “Ciudad de México” cambió a “Distrito Federal”, entidad que ya no existe
  • Los estados cuyo nombre lleva tilde ahora aparecen sin este signo ortográfico
  • La columna “fecha de llegada al país” fue eliminada
  • El contenido de la columna “Procedencia” cambió su contenido: de Italia, Estados Unidos, España, Francia Alemania, Singapur, China y contacto, agregaron NA, MEX, República, Trieste, Perú, Polonia, Suiza y otros países. 

Todos estos cambios implicaron que las personas que analizan estas tablas y ya habían desarrollado códigos o fórmulas para hacerlo, se vieron obligadas a cambiar su trabajo para obtener resultados, porque con los datos actuales estos dejaron de funcionar. 

Serendipia contactó a cuatro funcionarios de la Dirección General de Epidemiología de la Secretaría de Salud y a la Directora de Comunicación Social de la dependencia vía correo electrónico para conocer qué pasaba al interior de esta institución y por qué los datos no estaban disponibles en formato abierto ni con la calidad adecuada, pero no recibió respuesta. 

Finalmente, el lunes 13 de abril, la SSa hizo pública en el sitio de datos abiertos de la Dirección de Epidemiología esta información.

2 Comments Add yours

  1. Avatar Alberto dice:

    Gracias por compartir la noticia.

    Al tratad de analizar los datos surge un problema: El descriptor de la variable RESULTADO menciona “Identifica el resultado del análisis de la muestra reportado por el laboratorio de la Red Nacional de Laboratorios de Vigilancia Epidemiológica (INDRE, LESP y LAVE). (Catálogo de resultados diagnósticos anexo).” Sin embargo, no pude encontrar dicho catálogo en la liga mencionada en este artículo ni buscando en gob.mx. Saben a qué corresponden las categorías 1, 2 y 3 en la columna RESULTADO? Gracias de antemano.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *