La importancia de los datos y el advenimiento del pico
La importancia de los datos y el advenimiento del pico
Mario Castro Ponce (Universidad Pontificia Comillas), Manuel de León (Instituto de Ciencias Matemáticas CSIC, Real Academia de Ciencias y colaborador de BBVA OpenMind) y Antonio Gómez Corral (Universidad Complutense de Madrid) analizan en este artículo la necesidad de contar con datos fiables para lograr predecir la evolución del COVID-19.
Uno de los debates que se está produciendo en estos días trágicos es la necesidad de contar con datos fiables para conseguir predecir la evolución de la pandemia causada por el COVID-19. Hay dos maneras de producir modelos epidemiológicos. Uno, que es el que se está difundiendo mayoritariamente en los medios de comunicación y redes sociales en estos días, es el modelo determinista, basado en un sistema de ecuaciones diferenciales que conectan tres o cuatro conjuntos de datos o 'compartimentos'. En el modelo más sencillo, denotado por las siglas SIR, esas cajas de datos representan a los individuos sanos y susceptibles de ser infectados, los que están infectados, es decir, los ya contagiados, y los que han fallecido o se han curado.
Las ecuaciones nos dicen cómo varían esas cantidades con el tiempo, así lo que calculamos son las derivadas, es decir, las tasas de crecimiento o decrecimiento. Y esas tasas son proporcionales a ciertos parámetros. Por ejemplo, si queremos saber cómo va variando la tasa de individuos sanos, esta dependerá del número de individuos sanos en ese momento, pero también de los ya infectados y de la probabilidad o tasa de infección. Y se le pone un signo menos delante porque, desgraciadamente, ese número va a ir decreciendo. Si queremos ver cómo varía la cantidad de infectados, habrá que tener en cuenta también una tasa de recuperación sobre los infectados. Lo mismo ocurrirá con la variación de recuperados, que será una parte de los infectados. Y así se construye el modelo, que debemos al trabajo de tres luchadores contra la malaria: Ronald Ross, Premio Nobel de Medicina o Fisiología, Anderson McKendrick y William Ogilvy Kermack.
"Si no hay contactos físicos, no habrá contagios. También el uso de guantes y sobre todo mascarillas es esencial para evitar contagios"
Este tipo de modelos, el original y sus múltiples variaciones, se dicen deterministas porque si se introducen los datos iniciales, el modelo va dando las cantidades de sanos, infectados y recuperados en cualquier momento futuro. Así, se generan esas curvas que nos muestran en las televisiones. Son modelos que funcionan muy bien a gran escala, es decir, para predecir en una Comunidad Autónoma, o en un país como España, siempre que los datos que se utilicen para “alimentar” los modelos sean fiables. El otro método matemático alternativo se basa en los comportamientos individuales y sociales, y usan técnicas informáticas y de ciencia de datos; son más útiles en otro tipo de epidemias.
Para los modelos deterministas, los datos iniciales tienen que ser los más precisos posibles; pero si vamos recogiendo datos diariamente, podemos alimentar el modelo con los nuevos datos de ese día, y aumentar la precisión de la predicción. ¿Y para qué sirve esto? Para dos cuestiones claves. Primero, podemos calcular los recursos sanitarios que vamos a ir necesitando en los próximos días. Un problema intrínseco a la dinámica de epidemias es el tan manido crecimiento exponencial, que trae consigo dos desafíos. En primer lugar, uno psicológico: este tipo de crecimiento (progresión geométrica como aprendimos en el colegio) no es fácil de asimilar en nuestra mente. Cada día nos despertamos con la noticia de un nuevo récord de fallecidos o de infectados, pero es que la progresión geométrica es imparable: cada pocos días doblamos el número que teníamos. Esto es a la vez trágico y muy difícil de asimilar. El otro desafío del crecimiento exponencial es la predicción. Como ocurre (por razones distintas) en los sistemas caóticos, pequeñas variaciones en los datos pueden producir predicciones disparatadamente diferentes. De ahí la importancia de recoger buenos datos.
Si el número R0 es alto, vamos a tener un grave problema. Necesitamos que baje y, si es posible, que sea menor que 1. Entonces la epidemia se irá retirando
Recordemos que el principal problema que nos atañe es la limitación de los recursos sanitarios. La segunda cuestión decisiva es cómo conseguir entonces que el número de infectados vaya bajando y cómo lograrlo en el menor tiempo posible. Ahí está la clave de los dos parámetros que citábamos antes: la tasa de recuperación y la tasa de infección. El ya famoso número R0 (el factor reproductivo básico) es frecuentemente el cociente entre la tasa de infección y la de recuperación. Así que, si es alto, vamos a tener un grave problema. Necesitamos que baje y, si es posible, que sea menor que 1. Entonces la epidemia se irá retirando.
La pregunta es cómo conseguir que este número baje. Y la respuesta es lo que están haciendo todos los gobiernos del mundo, la reclusión en nuestros hogares. Si no hay contactos físicos, no habrá contagios. También el uso de guantes y sobre todo mascarillas es esencial para evitar contagios.
Y lo que sí debemos saber es que esto no acabará con el virus, simplemente lo mantendrá a raya. Mientras no haya antivirales específicos y eficaces o vacunas, el virus se retirará, sí, pero como las olas en la playa; volverá a atacarnos.