La Secretaría de Salud de México publica todos los días la base de datos abiertos sobre COVID-19. Sin embargo, esta información ha mostrado ser confusa para los ciudadanos que quieren analizarla. Esta guía muestra, paso a paso, cómo está estructurada la base de datos y qué es lo que contiene.
Esta guía describe la información que contiene la base de datos sobre COVID-19 publicada por la Secretaría de Salud (SSa) de México y el significado de las claves utilizadas. Además, explica por qué algunos análisis arrojan “inconsistencias” entre estos datos y los que muestra, por ejemplo, el mapa oficial de la dependencia.
El 20 de abril, la SSa de México publicó por primera vez una base de datos abiertos con la información sobre los casos positivos, negativos y sospechos de COVID-19. La base puede ser descargada en el sitio www.datos.gob.mx y todas las personas que así lo deseen, la pueden utilizar.
¿Qué información contiene esta base de datos?
La base de datos incluye un diccionario en donde hay dos archivos: los descriptores y el catálogo de datos. En el archivo “descriptores” están definidos los nombres de las variables, su descripción y el formato en que son presentadas, además del catálogo que es necesario consultar para entender las claves que contienen (cuando es el caso) como se muestra a continuación:
Nº | NOMBRE DE VARIABLE | DESCRIPCIÓN DE VARIABLE | FORMATO O FUENTE |
1 | FECHA_ACTUALIZACION | La base de datos se alimenta diariamente, esta variable permite identificar la fecha de la ultima actualizacion. | AAAA-MM-DD |
2 | ORIGEN | La vigilancia centinela se realiza a través del sistema de unidades de salud monitoras de enfermedades respiratorias (USMER). Las USMER incluyen unidades médicas del primer, segundo o tercer nivel de atención y también participan como USMER las unidades de tercer nivel que por sus características contribuyen a ampliar el panorama de información epidemiológica, entre ellas las que cuenten con especialidad de neumología, infectología o pediatría. (Categorías en Catalógo Anexo). | CATÁLOGO: ORIGEN |
3 | SECTOR | Identifica el tipo de institución del Sistema Nacional de Salud que brindó la atención. | CATÁLOGO: SECTOR |
4 | ENTIDAD_UM | Identifica la entidad donde se ubica la unidad medica que brindó la atención. | CATALÓGO: ENTIDADES |
5 | SEXO | Identifica al sexo del paciente. | CATÁLOGO: SEXO |
6 | ENTIDAD_NAC | Identifica la entidad de nacimiento del paciente. | CATALÓGO: ENTIDADES |
7 | ENTIDAD_RES | Identifica la entidad de residencia del paciente. | CATALÓGO: ENTIDADES |
8 | MUNICIPIO_RES | Identifica el municipio de residencia del paciente. | CATALÓGO: MUNICIPIOS |
9 | TIPO_PACIENTE | Identifica el tipo de atención que recibió el paciente en la unidad. Se denomina como ambulatorio si regresó a su casa o se denomina como hospitalizado si fue ingresado a hospitalización. | CATÁLOGO: TIPO_PACIENTE |
10 | FECHA_INGRESO | Identifica la fecha de ingreso del paciente a la unidad de atención. | AAAA-MM-DD |
11 | FECHA_SINTOMAS | Idenitifica la fecha en que inició la sintomatología del paciente. | AAAA-MM-DD |
12 | FECHA_DEF | Identifica la fecha en que el paciente falleció. | AAAA-MM-DD |
13 | INTUBADO | Identifica si el paciente requirió de intubación. | CATÁLOGO: SI_ NO |
14 | NEUMONIA | Identifica si al paciente se le diagnosticó con neumonía. | CATÁLOGO: SI_ NO |
15 | EDAD | Identifica la edad del paciente. | NÚMERICA EN AÑOS |
16 | NACIONALIDAD | Identifica si el paciente es mexicano o extranjero. | CATÁLOGO: NACIONALIDAD |
17 | EMBARAZO | Identifica si la paciente está embarazada. | CATÁLOGO: SI_ NO |
18 | HABLA_LENGUA_INDIG | Identifica si el paciente habla lengua índigena. | CATÁLOGO: SI_ NO |
19 | DIABETES | Identifica si el paciente tiene un diagnóstico de diabetes. | CATÁLOGO: SI_ NO |
20 | EPOC | Identifica si el paciente tiene un diagnóstico de EPOC. | CATÁLOGO: SI_ NO |
21 | ASMA | Identifica si el paciente tiene un diagnóstico de asma. | CATÁLOGO: SI_ NO |
22 | INMUSUPR | Identifica si el paciente presenta inmunosupresión. | CATÁLOGO: SI_ NO |
23 | HIPERTENSION | Identifica si el paciente tiene un diagnóstico de hipertensión. | CATÁLOGO: SI_ NO |
24 | OTRAS_COM | Identifica si el paciente tiene diagnóstico de otras enfermedades. | CATÁLOGO: SI_ NO |
25 | CARDIOVASCULAR | Identifica si el paciente tiene un diagnóstico de enfermedades cardiovasculares. | CATÁLOGO: SI_ NO |
26 | OBESIDAD | Identifica si el paciente tiene diagnóstico de obesidad. | CATÁLOGO: SI_ NO |
27 | RENAL_CRONICA | Identifica si el paciente tiene diagnóstico de insuficiencia renal crónica. | CATÁLOGO: SI_ NO |
28 | TABAQUISMO | Identifica si el paciente tiene hábito de tabaquismo. | CATÁLOGO: SI_ NO |
29 | OTRO_CASO | Identifica si el paciente tuvo contacto con algún otro caso diagnósticado con SARS CoV-2 | CATÁLOGO: SI_ NO |
30 | RESULTADO | Identifica el resultado del análisis de la muestra reportado por el laboratorio de la Red Nacional de Laboratorios de Vigilancia Epidemiológica (INDRE, LESP y LAVE). (Catálogo de resultados diagnósticos anexo). | CATÁLOGO: RESULTADO |
31 | MIGRANTE | Identifica si el paciente es una persona migrante. | CATÁLOGO: SI_ NO |
32 | PAIS_NACIONALIDAD | Identifica la nacionalidad del paciente. | TEXTO, 99= SE IGNORA |
33 | PAIS_ORIGEN | Identifica el país del que partió el paciente rumbo a México. | TEXTO, 97= NO APLICA |
34 | UCI | Identifica si el paciente requirió ingresar a una Unidad de Cuidados Intensivos. | CATÁLOGO: SI_ NO |
¿Qué significan las claves de la base de datos?
El estatus de cada variable está descrito con claves, es decir, números que corresponden a una u otra respuesta. A continuación son descritos los significados de cada clave:
ORIGEN
CLAVE | DESCRIPCIÓN |
1 | USMER |
2 | FUERA DE USMER |
99 | NO ESPECIFICADO |
SECTOR
CLAVE | DESCRIPCIÓN |
1 | CRUZ ROJA |
2 | DIF |
3 | ESTATAL |
4 | IMSS |
5 | IMSS-BIENESTAR |
6 | ISSSTE |
7 | MUNICIPAL |
8 | PEMEX |
9 | PRIVADA |
10 | SEDENA |
11 | SEMAR |
12 | SSA |
13 | UNIVERSITARIO |
99 | NO ESPECIFICADO |
SEXO
CLAVE | DESCRIPCIÓN |
1 | MUJER |
2 | HOMBRE |
99 | NO ESPECIFICADO |
TIPO DE PACIENTE
CLAVE | DESCRIPCIÓN |
1 | AMBULATORIO |
2 | HOSPITALIZADO |
99 | NO ESPECIFICADO |
SI/NO
CLAVE | DESCRIPCIÓN |
1 | SI |
2 | NO |
97 | NO APLICA |
98 | SE IGNORA |
99 | NO ESPECIFICADO |
NACIONALIDAD
CLAVE | DESCRIPCIÓN |
1 | MEXICANA |
2 | EXTRANJERA |
99 | NO ESPECIFICADO |
RESULTADO
CLAVE | DESCRIPCIÓN |
1 | Positivo SARS-CoV-2 |
2 | No positivo SARS-CoV-2 |
3 | Resultado pendiente |
ENTIDADES
CLAVE_ENTIDAD | ENTIDAD_FEDERATIVA | ABREVIATURA |
01 | AGUASCALIENTES | AS |
02 | BAJA CALIFORNIA | BC |
03 | BAJA CALIFORNIA SUR | BS |
04 | CAMPECHE | CC |
05 | COAHUILA DE ZARAGOZA | CL |
06 | COLIMA | CM |
07 | CHIAPAS | CS |
08 | CHIHUAHUA | CH |
09 | CIUDAD DE MÉXICO | DF |
10 | DURANGO | DG |
11 | GUANAJUATO | GT |
12 | GUERRERO | GR |
13 | HIDALGO | HG |
14 | JALISCO | JC |
15 | MÉXICO | MC |
16 | MICHOACÁN DE OCAMPO | MN |
17 | MORELOS | MS |
18 | NAYARIT | NT |
19 | NUEVO LEÓN | NL |
20 | OAXACA | OC |
21 | PUEBLA | PL |
22 | QUERÉTARO | QT |
23 | QUINTANA ROO | QR |
24 | SAN LUIS POTOSÍ | SP |
25 | SINALOA | SL |
26 | SONORA | SR |
27 | TABASCO | TC |
28 | TAMAULIPAS | TS |
29 | TLAXCALA | TL |
30 | VERACRUZ DE IGNACIO DE LA LLAVE | VZ |
31 | YUCATÁN | YN |
32 | ZACATECAS | ZS |
36 | ESTADOS UNIDOS MEXICANOS | EUM |
97 | NO APLICA | NA |
98 | SE IGNORA | SI |
99 | NO ESPECIFICADO | NE |
MUNICIPIO
CLAVE_MUNICIPIO | MUNICIPIO |
001 | AGUASCALIENTES |
002 | ASIENTOS |
003 | CALVILLO |
004 | COSÍO |
005 | JESÚS MARÍA |
¿Inconsistencias en los datos?
Conocer la estructura y el contenido de esta base de datos puede ayudar no solo a utilizarla, sino a saber a qué se refiere cada variable y cuál es la que una persona debe analizar para obtener cierta información.
Desde que la base de datos fue publicada, han existido malentendidos sobre la veracidad de los datos debidos a que la SSa visualiza ciertas variables y algunos proyectos independientes analizan otras, lo que provoca que los resultados no coincidan.
Por ejemplo, en el mapa publicado por la SSa está indicado que la información corresponde a casos acumulados por entidad de residencia. No obstante, la cifra de muertes corresponde a la entidad de la Unidad Médica. Al no conocer todas las variables que presenta la base de datos, podría parecer que el mapa es incorrecto o que el gobierno está publicando datos diferentes en sitios diferentes, cuando en realidad lo único que cambia es la selección de la variable que se muestra.
En este sentido, Serendipia considera que la SSa debe incluir notas aclaratorias en todas sus visualizaciones y publicaciones para informar a los ciudadanos sobre el origen de la información que presentan, así como la metodología utilizada en sus cálculos.
Muy bien, felicidades a todos. Hay que continuar con el esfuerzo.