Los datos sobre ocupación hospitalaria que publica la Secretaría de Salud son imposibles de replicar. La dependencia pone a disposición de la ciudadanía los porcentajes redondeados por entidad, jurisdicción, municipio y unidad médica, pero no publica las cifras originales con las que calcula dichas proporciones.

Análisis de datos por Yareli Ramos

Los datos sobre ocupación hospitalaria en México no son replicables. La Secretaría de Salud (SSa) presenta todos los días la información sobre ocupación hospitalaria en México: las camas de hospitalización general, con ventilador y de cuidados intensivos que están siendo utilizadas por pacientes con COVID-19 en el país. Los porcentajes de ocupación están disponibles para su consulta y descarga en la plataforma de la red Infección Respiratoria Aguda Grave (IRAG), pero con estos datos es imposible replicar los resultados presentados por la dependencia federal. 

Serendipia intentó calcular los porcentajes que la dependencia federal muestra en sus conferencias por medio de los datos desagregados por unidad médica disponibles en la plataforma de la red IRAG. Fue imposible.

Este medio digital descargó los archivos en formato csv disponibles en el sitio web gubernamental. Al calcular el promedio estatal basado en los porcentajes de ocupación hospitalaria por unidad médica, los resultados varían entre uno y cinco puntos porcentuales comparados con las cifras que presenta la SSa en dicha plataforma y en sus conferencias diarias.

Datos sobre ocupación hospitalaria en México: ocupación de camas en hospitalización general en Ciudad de México el 5 de enero de 2021. Información de la SSa.
Datos sobre ocupación hospitalaria en México: ocupación de camas en hospitalización general en Ciudad de México el 5 de enero de 2021. Resultado obtenido por Serendipia al promediar los porcentajes de ocupación por unidad médica publicados por la SSa.

En respuesta a un correo electrónico en el que son expuestas estas diferencias, la SSa dijo que al realizar el cálculo del porcentaje con la base de datos del sistema de la red IRAG, “hay diferencias mínimas por redondeo de decimales”. El ejemplo enviado por la SSa es de 0.03 puntos porcentuales para la ocupación hospitalaria en camas de hospitalización general en Ciudad de México el 5 de enero. Para Serendipia, la diferencia es de tres puntos porcentuales al utilizar los datos que la secretaría hace públicos por medio de la plataforma.

La diferencia radica en que los funcionarios de esta dependencia pueden hacer sus cálculos con base en el número de camas totales, camas ocupadas y camas disponibles; estas cifras fueron mostradas en el correo electrónico enviado a Serendipia en respuesta a la exposición de las diferencias porcentuales. Pero una persona que no trabaja en esta secretaría federal no puede tener acceso a esos datos, solo a los porcentajes redondeados. 

“Son datos con los que (las autoridades) están tomando decisiones y un ciudadano debería poder entender cómo y por qué se están tomando, y debería tener la posibilidad de replicarlos”, dice Alma Rangel, directora de Codeando México.

“Técnicamente son datos abiertos”, dice Boris Cuapio, desarrollador en Gobierno Fácil. “Son datos que están públicos y que están disponibles en un formato que puede ser leído en un sistema de cómputo”. Alma Rangel coincide en que la información cumple con las características técnicas para considerarla abierta, pero añade que “podríamos debatirlo, porque hay un segundo aspecto que es la replicabilidad”, es decir, publicar los datos necesarios para que cualquier persona pueda llegar al mismo resultado que la SSa.

La generación y publicación de los datos sobre capacidad hospitalaria en México

Este medio digital insistió en la diferencia de tres puntos porcentuales obtenida con la información pública disponible (es importante recordar que esta diferencia es solo para el promedio de ocupación hospitalaria general en la Ciudad de México el 5 de enero).

A esto, la SSa respondió que “en efecto, la forma correcta de hacer los cálculos porcentuales es con los datos nativos (es decir, el número total de camas, las camas ocupadas y las disponibles). Trabajar con porcentajes nunca te va a dar el mismo resultado”. 

Rangel dice que es normal que existan errores humanos en la creación y publicación de bases de datos, “pero si tú le dices a la autoridad que hay un problema porcentual de cinco por ciento, pues (que) tengan la capacidad de revisar qué es lo que está pasando, y no justificar que nunca va a coincidir lo que ellos presentan con lo que tú vas a calcular”. 

“Eso es no entender la utilidad de tener esos datos y malentender que (el gobierno) está haciendo algún tipo de concesión especial y que no debemos ser malagradecidos (quien pide o usa la información)”, dice Mario Romero Zavala, desarrollador de software y analista de datos. 

La SSa asegura que está trabajando en conjunto con el Instituto de Geografía (IG) de la Universidad Nacional Autónoma de México (UNAM) para poder mostrar la versión “nativa” de los datos sobre ocupación hospitalaria en México, pero que tanto el personal de la SSa como el del IG “trabaja en muchos otros proyectos además del sistema de la red IRAG”. 

Además de la publicación de estos datos, hay otro aspecto a considerar: la generación de los mismos. Es necesario “entender el proceso de recopilación de datos, de dónde viene la información”, dice Mónica Meltis, directora de Data Cívica

“Por eso siempre hay que exigir datos, pero también hay que hacer un ejercicio de reflexión y entender desde dónde están operando las cosas”, dice Óscar Elton, analista de datos en Data Cívica. 

Los datos de las mil 15 unidades médicas que son parte de la Red IRAG son ingresados “por medio una página electrónica dedicada. Cada director de unidad médica tiene la responsabilidad de designar a la persona o personas a cargo de notificar su ocupación en el sistema”, de acuerdo con Dwight Dyer, director general de información en Salud de la SSa, en respuesta a un correo electrónico dirigido por este medio digital. Este es un proceso que, de acuerdo con el funcionario, requiere de la colaboración de miles de personas en todo el país: desde las unidades médicas públicas y privadas de la red, la Secretaría de Salud y la UNAM.

El proceso es el siguiente: “Tras la revisión de ocupación en piso de cada unidad médica de la Red IRAG, los responsables de la captura de información ingresan los datos (al sistema). Los cortes de información son a día vencido, es decir, se reporta la información de la última jornada completa.  La información se registra y resguarda en la infraestructura de la Dirección General de Tecnologías de Información de la SSa. De ahí se alimenta el Sistema de Información de la Red IRAG, que reside en infraestructura de la Dirección General de Tecnologías de Información y Comunicación de la UNAM, vía webservice. Las transferencias de información ocurren en la madrugada de cada día, para dar oportunidad a las unidades en todos los husos horarios de cargar su información”.

Pero los datos que son ingresados al sistema no pueden ser descargados por medio de la plataforma de la Red IRAG. Dyer dice que “la información (publicada en la plataforma) refleja la situación de ocupación de la jornada anterior, y no la extraordinariamente dinámica situación de los hospitales en el día de consulta”, pero asegura que la SSa busca “mejorar la experiencia del usuario final (en coordinación con la UNAM)”y que “tomando en cuenta las restricciones de tiempo del personal especializado de ambas instituciones, se buscará incluir información más específica sobre la infraestructura hospitalaria en las próximas semanas”.

Al respecto, Mario Romero dice que “si ya tienes los datos, permitir su descarga en un sistema es algo que no toma mucho tiempo. Aun con un sistema viejo, tomar una base de datos, filtrarlos y hacerlos públicos es una labor que no tiene por qué llevar más de unas horas. Eso es difícil de entender: si no trabajas en ese (campo), suena como que hay que construir algo y que se complica si el equipo de programación no es muy grande, pero esa no es la realidad”.

Meltis apunta que, al mismo tiempo, existe una disparidad en el acceso a recursos dentro del mismo gobierno: “hay lugares en donde el sistema (con el que capturan los datos) no se puede ni conectar por falta de internet o computadoras”. 

Priorizar los datos en una pandemia

¿Recopilar y publicar datos durante una pandemia debería ser una prioridad? Para Boris Cuapio, la información sobre ocupación hospitalaria durante la pandemia de COVID-19 es vital: “ya no es una cuestión académica, es una cuestión de supervivencia, incluso por puro interés personal, porque en este momento literalmente piensas cómo vas a saber a dónde ir si te enfermas”.

Al hablar sobre datos abiertos, a veces es difícil ejemplificar cómo impactan en la vida de las personas. Pero en este caso es muy claro: “es tan sencillo como que tú me puedas decir a qué hospital me tengo que ir a recibir atención”, dice Alma Rangel. “Además, ir viendo esas tendencias (de ocupación hospitalaria) también te ayuda a tomar decisiones: si sales o no sales, si puedes visitar a alguien. A eso se tiene que traducir, ese es el lado humano de estos datos. Es muy fácil decir que solo hablamos de tendencias generales, pero un cinco por ciento es la diferencia entre tener un hospital ocupado al 95 por ciento o al 100 por ciento”. 

Desde el punto de vista de la transparencia y el acceso a la información, Mario Romero dice que “en un caso de emergencia nacional es impresionante que no sea la prioridad no solo eliminar cualquier posible suspicacia o duda, sino que podamos nosotros (los ciudadanos) tener más confianza porque ellos (el gobierno) están siendo totalmente transparentes”.

Además, “los datos son herramientas que permiten diseñar políticas públicas y ajustar las estrategias durante la emergencia (sanitaria). Sin eso no hay posibilidad de adaptarse al contexto”, dice Mónica Meltis.

Al gobierno, esta información le “permite conocer la situación de ocupación de los hospitales de la Red IRAG para atención a pacientes de infección respiratoria aguda grave (IRAG), incluyendo COVID-19. Esta información se usa para que el Centro Regulador de Urgencias Médicas (CRUM) federal se coordine con los CRUM estatales para referir a pacientes en busca de atención médica a unidades con disponibilidad de camas de hospitalización general o con ventilador”, dice Dwight Dyer.

Además, con estos datos la SSa puede “supervisar y coordinar con las autoridades sanitarias de cada entidad las acciones para aumentar o disminuir el número de camas para mantener márgenes de atención adecuados para pacientes de IRAG y otras afecciones”, de acuerdo con el funcionario federal.

A pesar de la utilidad que tiene esta información para el gobierno, mejorar los sistemas con los que capturan los datos parece no ser una prioridad. En mayo de 2020, Serendipia habló con Ricardo Cortés, director general de Promoción de la Salud de la SSa. En ese entonces, el funcionario dijo que el sistema con el que se capturaban las estadísticas sobre COVID-19 en México había sido diseñado para atender la pandemia de influenza, es decir, tenía 11 años de antigüedad. 

Cortés también dijo que la secretaría estaba trabajando para cambiar ese sistema por uno que se adaptara a sus nuevas necesidades, el cual estaría listo en un par de semanas. Esa entrevista fue publicada el 13 de mayo de 2020. Hasta ahora, este medio digital no tiene información sobre el cambio del sistema. 

Serendipia es una iniciativa independiente de periodismo de datos. Puedes apoyarnos suscribiéndote a nuestro canal de YouTube

También nos puedes seguir en Twitter, Facebook e Instagram

One Comment Add yours

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *