BBVA colabora con el MIT para mejorar la detección del fraude con tarjeta
BBVA ha trabajado con un equipo de investigadores del Massachusetts Institute of Technology (MIT) en el desarrollo de un modelo que puede reducir en un 54% el nivel de falsos positivos en la detección de operaciones fraudulentas con tarjeta, gracias a algoritmos basados en ‘machine learning’.
Desde hace años los bancos emplean técnicas de aprendizaje automático o ‘machine learning’ para detectar operaciones de fraude con tarjeta. Para ello, se entrena a los algoritmos para que aprendan a reconocer los patrones de comportamiento habituales en la comisión de fraudes y sean capaces de bloquear nuevas operaciones que consideren “sospechosas”.
¿El inconveniente? Los falsos positivos. A menudo cuando un cliente paga una cantidad inusual o está en una localización nueva, la tarjeta se bloquea porque el sistema interpreta la anomalía como “sospechosa” de manera errónea.
Esto se debe a que el uso de estas técnicas —muy exitosas en otros campos—, presentan una serie de limitaciones cuando se aplican a la detección del fraude en tarjetas: para poder detectar un mayor número de operaciones fraudulentas reales, a cambio también se produce un mayor número de falsos positivos, es decir, se identifican de forma errónea como fraudulentas operaciones normales que no lo son.
Los obstáculos
Uno de los retos permanentes en BBVA es conseguir mejorar la experiencia de usuario del cliente en estas situaciones sin reducir los niveles de seguridad ya conseguidos. Con este objetivo, el equipo de Seguridad Corporativa y Riesgos Tecnológicos (CS&ER, por sus siglas en inglés) de BBVA inició en 2015 una colaboración con el departamento de CSAIL (Computer Science and Artificial Intelligence Lab) del MIT para buscar nuevas formas de reducir el nivel de falsos positivos. El resultado de este trabajo ha sido publicado como un estudio conjunto, que fue presentado recientemente por el MIT en el ‘European Conference for Machine Learning’ y recogido en un artículo en el portal de noticias del MIT.
Uno de los problemas que se identificó a partir del trabajo con MIT fue la escasez de variables matemáticas (denominadas ‘características’ o ‘features’) que se podían extraer de los datos que se emplean para entrenar los sistemas de ‘machine learning’. Es decir, la cantidad de información detallada de la que se dispone para enseñar a los algoritmos qué comportamientos son realmente sospechosos es limitada.
Otro problema añadido es la escasez de ejemplos útiles que sirven para entrenar a los modelos, lo que los investigadores comparan con “encontrar agujas en un pajar”. Los algoritmos deben ser capaces de identificar anomalías que ocurren muy pocas veces: solo 17 de cada 100.000 operaciones de tarjeta es fraudulenta, según cifras del Banco de España.
La solución
A través de la colaboración entre MIT y BBVA se han aplicado técnicas novedosas de ingeniería automatizada de características (‘automated feature engineering’) para tratar de mejorar esta situación. En concreto se ha empleado un modelo desarrollado por los investigadores Kalyan Veeramachaneni y James Max Kanter del MIT –bajo la denominación de ‘Deep Feature Synthesis’–, que permite extraer características con un alto nivel de detalle de cualquier conjunto de datos de forma automática.
Este nuevo enfoque ha permitido extraer más de 200 nuevas características adicionales de cada transacción que sirven para describir con mayor detalle el comportamiento de las operaciones con tarjeta y mejoran los resultados de los motores de detección. Algunas de estas nuevas características que sirven para afinar los aciertos indican, por ejemplo, si el usuario está presente durante la compra o el tiempo que se emplea de media en determinados comercios. De esta forma, es posible identificar con mayor precisión cuándo los hábitos de gasto de un usuario de tarjeta específico se desvían de la norma.
Como consecuencia, se ha logrado una reducción drástica de falsos positivos manteniendo el mismo nivel de detección de fraude, comparado con otros sistemas y productos existentes. En concreto, tras haber sido puesto a prueba con un conjunto de datos de 1,8 millones de transacciones de BBVA, el modelo ha permitido reducir los falsos positivos en un 54% frente a los modelos tradicionales, lo que los investigadores del MIT estiman que podría haber ahorrado al banco unos 190.000 euros.
“Tomando como punto de partida este modelo diseñado y entrenado por el equipo del MIT, como investigación interna realizada en el banco, hemos sintetizado nuevas características usado datos adicionales de tarjetas y comercios que no estaban disponibles en el momento la investigación original”, explica Carlos Capmany, responsable del proyecto en el área de CS&ER de BBVA.
“Como resultado, se han conseguido reproducir de forma consistente los ya de por sí espectaculares resultados de reducción de falsos positivos obtenidos por el equipo de investigación del MIT, y ello con un incremento mínimo en el coste computacional global del sistema", añade Capmany.
Los beneficios del modelo
La aplicación del resultado de esta investigación en los sistemas de detección de fraude en tarjeta utilizados por BBVA ha demostrado potencial para mejorar la satisfacción los clientes en las operaciones con tarjeta sin afectar a los niveles de seguridad actuales.
Además, el uso de esta técnica desarrollada por el MIT se está usando en otros terrenos de investigación dentro del área de CS&ER de BBVA en el uso de ‘machine learning’ aplicado a la ciberseguridad, en los que se dan circunstancias similares de partida: pocas variables para entrenar los sistemas de ‘machine learning’, y datos de entrada muy dispares.
"Esta técnica de síntesis automatizada de características y el conocimiento aportado por el MIT en este proyecto, nos ha aportado una nueva forma de enfocar la investigación en otros retos en los que inicialmente disponemos de un conjunto reducido de características. Por ejemplo, estamos obteniendo resultados igualmente prometedores en la detección de comportamientos anómalos en tráfico de red interna o en operativas de mercados, por mencionar dos ejemplos", explica Sergio Iglesias, otro de los integrantes del equipo de CS&ER que ha participado en el proyecto.