Tuesday, February 04, 2020

Coronavirus y big data: como lo usan (de la nota en papel a Netflix)


En nuestro siempre emergente mundo tecnológico en construcción, basta que llegue un virus para devolvernos a la realidad de lo vulnerables que somos y del peligro que supone educar una sociedad entera en la creencia de que somos (casi) invulnerables gracias a la ciencia

El caso del Coronavirus es el ejemplo más rotundo de que no podemos controlar todo, pero también que nuestra capacidad de respuesta es ahora mejor que hace apenas 6 años cuando el SARS apareció

El Coronavirus es un caso ideal para todo este conjunto de técnicas que aplicamos en el análisis de grandes cantidades de información dispersa y en general no estructura y que llamamos genéricamente Big Data

¿Que esta haciendo el Big Data para evitar que se infecte más gente y tomar decisiones mejores en menor tiempo?

Lo primero es que las fuentes de datos son hoy mucho mayores pero también la velocidad a la que se transmiten estos datos a todo tipo de organizaciones como la Organización Mundial de la Salud o centros de investigación como la Universidad John Hopkins, cuya excelente web muestra un mapa con los casos de coronavirus en tiempo real

Pero los datos alguien los tiene que tomar de algún lugar y eso precisamente es lo que hacen los cientos de investigadores que en las zonas afectadas toman nota, muchas veces con papel y lapiz , de lo que ven, aunque parezca paradójico esto no ha cambiado nada y sigue siendo clave para analisis del fenomeno

Pero una vez que estos datos están disponibles los analistas pueden comparar por ejemplo los casos confirmados con esas listas de vuelo que nos dicen quien va en un avión y adonde , de modo que se puede predecir como puede extenderse geograficamente el virus

Un factor critico en una epidemia es saber con exactitud con quien se ha relacionado la persona infectada , algo que como se puede entender lleva mucho tiempo pues en muchos casos se hace a base de preguntar que hizo, cuando donde y con quien el afectado

en esto si que hemos avanzado mucho ya que por ejemplo se emplean técnicas de Machine Learning para analizar miles de noticias y en general escritos en prácticamente todo lo que se publica en Internet, algo que por ejemplo hacen empresas como BlueDot

Pero hay otras técnicas que aunque pueden parecer secundarias se usan ya que no hay medio menor cuando la amenaza es grande. Por ejemplo: los investigadores usan indicadores como la temperatura corporal (anormal) que detectan dispositivos como algunos smart watches o incluso un consumo anormalmente (alto) de muchas videos a la vez (binge) en Netflix

Es evidente que sin estas tecnicas de analisis habría mucho más caos y más infectados. lo que nos habla de que la ciencia de datos tiene mucho recorrido laboral de aquí en adelante y que este no se limita a think tanks de opinión o medios informativos....


No comments: