“Conocimiento es poder” es una frase atribuida a Francis Bacon, filósofo, escritor y abogado del siglo XVI, cuya interpretación tiene muchas variantes. Si en pleno siglo XXI se vincula esta frase con términos como ‘big data’, ‘geolocalización’ y ‘machine learning’ se obtiene información sumamente valiosa, que se acrecienta al conjuntar diferentes fuentes para un mismo propósito —en general, con fines sociales o de atención a desastres— con el desafío de mantener la confidencialidad de la información. Y así se enriquece la frase: “Conocimiento es poder y puede salvar vidas.”
Bancos, empresas, redes sociales y servicios de telefonía móvil poseen una gran cantidad de información que se genera por sus operaciones diarias y por las interacciones que se realizan en los puntos de contacto (oficinas, aplicaciones móviles, TPV, llamadas telefónicas, etcétera) con sus clientes. Cada entidad puede analizar dicha información para obtener mejoras en sus productos, identificar necesidades y patrones de comportamiento, así como para desarrollar nuevos productos. Todo esto dentro del marco de la Ley Federal de Protección de Datos Personales en Posesión de Particulares (LFPDPPP).
Un claro ejemplo de cómo utilizar la información es el proyecto generado por BBVA Data & Analytics denominado Urban Discovery. En éste, con la información de las transacciones realizadas con tarjetas bancarias, se pueden determinar áreas funcionales y dinámicas que se presentan en una ciudad, esto manteniendo la privacidad de todos los tarjetahabientes. En su estudio para la Ciudad de México se utilizaron más de 281 millones de transacciones analizadas a lo largo de un año, las cuáles se registraron en 110,000 comercios.
Otra aplicación en el uso de los datos es el análisis que se realizó del impacto del huracán Odile en Baja California Sur, en septiembre de 2014. Utilizar ‘big data’ puede potenciar, incluso, el turismo de México, cómo lo demuestra un estudio elaborado en conjunto con la Secretaría de Turismo (SECTUR).
Integrar información de otras entidades
¿Qué sucede si se agrega a un estudio la información del uso de telefonía móvil, el comportamiento de las redes sociales, el uso de datos (internet) y la movilidad de las personas, por mencionar algunas? Para el caso de desastres naturales, como Odile, se podrían establecer protocolos de actuación más precisos y con mayor efectividad antes, durante y después del evento. Sin embargo, ¿dónde queda la privacidad de la información como individuos?
Carlos González Munguía, de Data & Analytics de BBVA Bancomer, durante su participación en el seminario 'Privacidad y confidencialidad de la información en la era digital', organizado por el Instituto Nacional de Estadística y Geografía (INEGI), explicó la forma como los algoritmos trabajan para evaluar una solicitud de información y cuándo la valoración indica que se pueden compartir los datos manteniendo la privacidad de los mismos.
Carlos González Munguía, de Data & Analytics de BBVA Bancomer.
Incorporar información de distintas fuentes a un estudio se le conoce como la agregación, la cual —en sentido estadístico— es un proceso de minería de datos e información en el que se busca, recopila y entrega información. “Existe la idea de que cuando se agrega un dato a un estudio se obtiene confidencialidad, es decir, una vez agregado ya es difícil que se llegue a saber de dónde viene el dato o quién lo proporcionó, lo cual es incorrecto”, precisó González.
"El reto es involucrar a las distintas entidades para integrar la información y hacerlo protegiendo y respetando los datos de cada una de las personas"
Las medidas de protección de la privacidad consideran la utilización de algoritmos en el uso de datos agregados, lo que permite establecer criterios matemáticos que aseguran que la información de las personas, comercios y entidades se mantengan de forma privada. El algoritmo de privacidad o competencia tiene como objetivo que no se proporcionen estadísticas agregadas en el caso de que esta información pueda poner en riesgo la ley de privacidad.
Adicionalmente, se utiliza la 'condición acumulada', que consiste en almacenar la información de las consultas previas con la finalidad de que la suma de las que se han realizado no permita conocer un dato privado.
La utilización de los datos de diversos sectores productivos y ámbitos sociales puede constituir una fuente de información que permita replantear los protocolos de emergencia ante situaciones de desastres naturales. "El reto es involucrar a las distintas entidades para integrar la información y hacerlo protegiendo y respetando los datos de cada una de las personas", señaló Carlos González.