Aprendizaje automático en proveedores de tarjetas de crédito: el caso de Amex
Empresas del sector de las tarjetas de crédito aplican desde hace tiempo técnicas de aprendizaje automático en plataformas Apache Hadoop para captar nuevos clientes, incrementar el volumen de negocio, personalizar recomendaciones o detectar fraudes.
Cada vez son más las empresas dedicadas a los servicios financieros que usan aprendizaje automático para el almacenamiento, extracción y análisis de los datos. Uno de los sectores donde se está desarrollando es el de la tarjetas de crédito, donde uno de los proveedores más potentes, American Express (Amex), está aplicando técnicas de aprendizaje automático con buenos resultados.
Los proveedores de tarjetas pueden usar técnicas de aprendizaje automático para captar nuevos clientes, aumentar su volumen de negocio, proponer recomendaciones personalizadas para los consumidores o detectar operaciones de fraude. Chao Yuan, vicepresidente senior de American Express, explicó, durante un evento organizado por un think tank en Sillicon Valley, cómo la compañía está usando el aprendizaje automático con dos objetivos: tomar decisiones que impulsen su estrategia de mercado y utilizar mejor sus datos.
1. Captación de nuevos clientes
El aprendizaje automático permite a cualquier empresa adaptar sus productos a las necesidades de sus consumidores y explotar todas las oportunidades de las campañas multicanal de captación de clientes. Antes del uso masivo de datos y el aprendizaje automático, las altas de nuevos clientes en Amex procedían casi en su totalidad de las promociones enviadas por correo directo a los consumidores.
Hoy en día, gracias a internet y el aprendizaje automático, cualquier empresa es capaz de hacer modelos predictivos que sirvan para proporcionar ofertas a medida de sus clientes potenciales. En American Express han pasado de conseguir nuevos clientes exclusivamente a través del correo a disponer de muchas altas online. Esto tiene una ventaja asociada: los costes del correo son mayores que los del canal digital.
2. Mejores datos, más transacciones
El negocio de American Express se resume en una frase: más transacciones, más beneficios; menos transacciones, menos ingresos. En la actualidad, Amex cuenta con más de 100 millones de tarjetas en todo el mundo, con un volumen de operaciones entre particulares y empresas que ronda los 950.000 millones en billetes. En 2014, Amex ganó casi 5.900 millones de dólares, un 4% más que en 2013.
¿Qué hace American Express para ganar más dinero cada año? Utiliza técnicas de análisis de datos para extraer información de valor de todas las combinaciones posibles en las transacciones que se producen entre todos los compradores y vendedores que usan sus tarjetas. De cada una de esas operaciones, Amex se lleva un porcentaje. Aumentando las transacciones, incrementa sus ingresos.
Entender qué, cómo y por qué usan sus tarjetas los consumidores en relación a los productos y servicios de sus vendedores facilita el aumento de las operaciones.
Para llevar a cabo el tratamiento de este gran volumen de datos, American Express implementó su plataforma actual Sync Platform en Apache Hadoop, la cual trabaja con MapReduce y un sistema de almacenamiento de archivos distribuido (HDFS). Este sistema sustituyó al antiguo análisis mediante bases de datos relacionales. Algunas de las características fundamentales de la plataforma son:
- Nació hace tres años con un cluster Hadoop de diez nodos. En la actualidad no se conoce el volumen real de la infraestructura.
- Cada uno de los nodos tiene, por lo general, ocho núcleos x86 o más por zócalo y toda la infraestructura contaría con unos 300 núcleos en total.
- Cada rack (combinación de nodos en Hadoop) cuenta con casi un Petabyte de datos.
- Cada máquina dispone de dos redes 10 Gb/s Ethernet para conectar los nodos del cluster.
- Se ejecuta tanto en tiempo real como en aplicaciones en lotes.
3. Recomendaciones personalizadas
American Express utiliza técnicas de aprendizaje automático en sus aplicaciones móviles. El consumo de información se ha disparado en este tipo de dispositivos y es ahí donde está gran parte de la demanda. En la actualidad, Amex usa algoritmos para crear recomendaciones personalizadas de productos o servicios, como por ejemplo recomendaciones de restaurantes de su lista de negocios asociados.
El algoritmo recaba, siempre y cuando el usuario le dé permiso para hacerlo, toda la información disponible sobre sus hábitos de consumo, ingresos y gastos y elaborar así un modelo predictivo y de recomendación que se ajuste a sus gustos y necesidades. Amex es capaz de recomendar, con una elevada probabilidad de éxito, el restaurante donde un usuario podrá consumir productos de sus partners y, además, pagar con alguna de sus tarjetas, lo que implica ventajas para el cliente.
Recabar todos esos datos comerciales y financieros exige una infraestructura potente y veloz. La creación del modelo y el análisis de la información también. La plataforma en Apache Hadoop implementada por Amex tiene esa capacidad.
4. Detectar operaciones de fraude
Las técnicas de aprendizaje automático y la infraestructura de análisis de datos de American Express es lo que le permite decidir si una operación con alguna de sus tarjetas de crédito es un posible fraude o no y hacerlo en milisegundos. Lógicamente, este tipo de operaciones de detección temprana de fraude no tendría sentido si cada pago con tarjeta se retrasara horas o incluso minutos.
¿Cuál es el avance significativo de plataformas distribuidas en Hadoop como MapR? Su capacidad para tomar decisiones en tiempo real con el análisis de todos los datos, no sólo con una muestra, sin pasos intermedios y sin provocar alteraciones en los usuarios. MapR le facilita a Amex generar patrones de predicción mucho más precisos porque se generan con todos los datos históricos de transacciones, no sólo con una pequeña muestra de las mismas.
Eso posibilita tres cuestiones importantes:
- El número de operaciones legales rechazadas pensando que eran transacciones fraudulentas se reduce considerablemente (esto es lo que se conoce como falso positivo). El objetivo es detectar operaciones ilegales sin generar falsos positivos y el consiguiente enfado en los clientes.
- Crece la detección de operaciones irregulares sin precedentes.
- MapR soporta distintos métodos de aprendizaje supervisado y no supervisado, lo que permite que el modelo predictivo sea más eficiente y se actualice en menos tiempo. Eso implica menor coste para las empresas.