Cómo un algoritmo para detectar asteroides abrió mi camino en la ciencia de datos
Cada año, la NASA lanza su concurso Space Apps Challenge, en el que reta a científicos e innovadores de todo el mundo a resolver algunos de los desafíos de la industria espacial. En 2016, fui una de las científicas ganadoras de este premio gracias a un algoritmo capaz de detectar y clasificar objetos próximos a la Tierra o NEOS (‘Near Earth Objects'). Ahora trabajo como científica de datos en BBVA, donde desarrollo modelos para la detección del fraude. Esta es mi historia.
Nuestro planeta está rodeado por miles de asteroides, cometas y desechos espaciales, que orbitan continuamente a nuestro alrededor atrapados por la atracción del Sol y otros astros cercanos. Dependiendo de su tamaño y composición, algunos de ellos son considerados ‘potencialmente peligrosos’ por la NASA, dado que su trayectoria podría hacerlos entrar en contacto con la Tierra en algún momento.
La NASA dedica esfuerzos a la monitorización y seguimiento constante de estos objetos para saber dónde están y qué probabilidades hay de que pudieran causar algún daño. Este fue precisamente uno de los retos que la agencia espacial planteó a científicos noveles de todo el mundo en la convocatoria de 2016 de su competición Space Apps Challenge, uno de los mayores ‘hackathones’ del mundo. En concreto, el reto planteado era desarrollar un sistema que demostrase “cómo el ‘machine learning’ podría usarse para evitar que acabemos teniendo el mismo destino fatal que los dinosaurios”.
Y este fue el reto que decidí tratar de resolver junto a un excepcional equipo. El resultado fue el proyecto Deep Asteroid, un sistema inteligente basado en ‘deep learning’ capaz de saber cuándo se produce algún cambio (de color, forma o composición química) en alguno de estos objetos y que predice lo que va a hacer a continuación. Nuestro programa quedó finalista a nivel global. Fue seleccionado entre los 25 mejores proyectos de todo el mundo entre más de 2.000 proyectos, y entre los cinco mejores en la categoría de mejor uso de datos. Utilizamos TensorFlow, la biblioteca de código abierto desarrollada por Google, para predecir la probabilidad de colisiones con los objetos próximos a la Tierra: el algoritmo pudo rastrear los patrones de vuelo de aproximadamente 40.000 asteroides, 1.000 cometas y cientos de fragmentos de escombros espaciales.
Ahora, Google ha recogido esta historia como parte de su serie de vídeos Search On, en los que cuenta relatos en primera persona sobre usos de su tecnología.
Del diseño 3D a los asteroides y a las finanzas
Siempre me interesó la tecnología. Escribí mi primer videojuego con 12 años, aunque por tradición familiar estudié arquitectura y en concreto me especialicé en la creación de visualizaciones 3D. Más adelante creé mi propia empresa de animación y videojuegos en Madrid, donde empecé a interesarme en el mundo de la programación y decidí hacer un curso en esta disciplina para entender los procesos técnicos de generación de productos. La investigación en el área de ‘software’ llevó a despertar mi interés por el área de ciencia de datos.
En concreto me fascinó el mundo del aprendizaje automático y decidí seguir formándome para convertirme en científica de datos. Fue precisamente durante mi etapa de formación en este ámbito cuando empecé a presentarme a diferentes desafíos para poner a prueba las habilidades aprendidas y uno de ellos fue reto de la NASA. De hecho, fue a partir de mi participación en esta competición de donde surgió la oportunidad de presentar mi proyecto en el evento Big Data Spain. Allí pude conocer a personas de BBVA Labs y fue entonces cuando surgió mi oportunidad de entrar a trabajar en el banco como científica de datos.
A día de hoy trabajo en el diseño y ejecución de modelos de ‘machine learning’ relacionados con el mundo financiero. En concreto, trabajo aplicando esta tecnología para mejorar la detección del fraude en el banco. Una de las cosas que más disfruto en mi día a día, sin duda, es enfrentarme continuamente a nuevas hipótesis y ponerlas a prueba. Nunca nos contentamos con los ejemplos ya construidos previamente, sino que nos cuestionamos cada caso y buscamos siempre la mejor solución para aplicar estos modelos al mundo de la banca.
Parte de mi trabajo también consiste en leer y analizar publicaciones científicas y entender a nivel matemático y conceptual de manera profunda los últimos avances en investigación para aplicarlos a nuestro día a día. Trabajar con grandes cantidades de datos nos obliga a pensar siempre a gran escala.
Nunca pensé que lo que comenzó como un desafío para detectar asteroides me llevaría ahora a utilizar la misma tecnología para combatir el fraude financiero y desarrollar mi carrera.
*Gema Parreño es científica de datos en BBVA Innovation Labs.
*La foto de la cabecera es propiedad de Google.