Cerrar panel

Cerrar panel

Cerrar panel

Cerrar panel

Tecnología Act. 18 ago 2017

“Las contraseñas son incómodas y poco seguras, tienen los días contados”

Emilio Martínez, CEO de Agnitio, la empresa especializada en sistemas de biometría de voz, destaca la "huella vocal" para la autenticación de las personas.

recurso - seguridad digital - contraseña - internet - datos - big data

¿Cómo surge Agnitio?

AGNITIO surge como un spin-off de la Universidad Politécnica de Madrid en el año 2004.  El grupo de investigadores del departamento de tratamiento de señales trabajó durante años con la Guardia Civil para desarrollar un sistema de biometría de voz que les permitiera identificar a criminales y terroristas usando la voz. Este sistema fue conocido por otras policías europeas generando bastante interés. Los socios fundadores negociaron con la Universidad un contrato de transferencia de tecnología y de esa manera surgió AGNITIO.

cibbva-entrevista-emilio

Emilio Martínez

¿Cuál es el perfil de sus profesionales?

El 92% de los empleados son Ingenieros o licenciados en áreas de tecnología avanzada. Es una empresa eminentemente tecnológica con un componente muy alto de I+D+i.

¿En cuántos países están presentes y qué sector les interesa más o está más interesado en sus servicios?

Agnitio tiene instalaciones en más de 40 países de todo el mundo. Las áreas geográficas donde tenemos más presencia son Europa occidental, Latinoamérica y Estados Unidos. En EEUU tenemos una subsidiaria que comercializa y da soporte a nuestros clientes en Norteamérica. Respecto a los segmentos de mercado nuestra presencia es sobre todo en el sector seguridad de gobiernos (Policías, Inteligencia y organizaciones de Defensa), seguido del sector Financiero.

¿Cuáles son las características de la verificación biométrica por voz?

Cuando una persona habla, además de la información que transmite en forma de palabras existe una huella en las ondas sonoras creada por las características únicas de su tracto vocal: la laringe, la cavidad nasal, el paladar, etc. Esta huella vocal es independiente del idioma que la persona esté usando, las frases que esté diciendo o el estado de ánimo del individuo. Nuestra tecnología es capaz de extraer esa información y guardarla en forma de “Huella vocal” numérica. Cuando una persona desconocida está hablado por teléfono, por ejemplo, esa voz puede compararse con las huellas vocales almacenadas e identificar con un altísimo grado de precisión qué persona es la que está hablando.

¿Las herramientas que se utilizan son complejas y su coste alto?

El sistema es puramente software. Es decir la voz puede grabarse con cualquier micrófono y no es necesario usar ningún sistema informático de procesamiento especial. Se usan los servidores y ordenadores normales. Es el software de procesamiento de la señal lo que es complejo. Algoritmos matemáticos muy complejos pero programados de manera eficiente para que la respuesta sea en fracciones de segundo con los procesadores actuales. El coste depende del tamaño del proyecto, medido en número de huellas vocales que se van a usar o/y de número de procesos en paralelo que van a hacer uso de nuestra tecnología. Son sistemas que no están accesibles por su coste al consumidor individual sino que son adquiridos e implementados por organizaciones gubernamentales o entidades financieras.

¿Cómo ha evolucionado la tecnología en este campo?

La biometría de voz se viene estudiando desde los años noventa, pero no es hasta principio del siglo XXI cuando salen los primeros sistemas que podían usarse de manera eficaz. El primer prototipo de nuestro sistema de identificación forense lo entregó la UPM a la Guardia Civil en el año 2000. Desde entonces varios grupos punteros de investigación, entre los que tenemos el orgullo de encontrarnos, han ido mejorando y modificando los algoritmos para obtener mejores resultados.

Nuestros productos ya van por la cuarta generación de tecnología. A la vez que se ha mejorado la precisión, se ha conseguido hacer los cálculos de manera mucho más rápida y con menos recursos. Nuestros primeros sistemas de monitorización de llamadas por biometría vocal necesitaban 50 veces más procesadores de lo que necesitan hoy.

¿Qué ventajas tiene con respecto a otros métodos de identificación (huellas, iris…)?

Las distintas modalidades biométricas no compiten entre sí, sino que se complementan en un entorno de autenticación multi-factor. Cuando nos acercamos a una persona usamos todas nuestros “sensores” para identificarla: su cara, su manera de andar, su voz etc. De la misma manera, en el futuro para identificar a alguien de manera automática se usarán todas las posibilidades que nos ofrecen los dispositivos. A veces unas serán más importantes que otras. La voz es muy relevante en situaciones de autenticación remota, cuando no se puede ver o “tocar” a la persona. A través de la comunicación telefónica por ejemplo.

¿Son más eficientes?

Los sensores necesarios para hacer una autenticación por voz son los micrófonos, y estos los llevamos todos hoy en día en nuestro bolsillo (el teléfono móvil) o los tenemos en nuestro ordenador. En ese sentido es mucho más eficiente desde el punto de vista de coste que una huella dactilar o que el reconocimiento por iris, que necesitan un sensor especial con un cuidado especial. Por otro lado es la modalidad más natural. Todo el mundo está acostumbrado a hablar, a hablar por teléfono. Es algo que no se considera intrusivo si lo comparamos con hacer una foto de tus ojos o tomar tu huella. Además el uso de la voz para interactuar con nuestro entorno está aumentando.

En el futuro nos comunicaremos con múltiples dispositivos en el coche, en el hogar o en el trabajo usando la voz para darles comandos u obtener información. Usar esa misma voz como una forma de autenticarnos es algo que será más natural que el uso de otra modalidad biométrica. Las mismas frases que usamos para hablar con los asistentes virtuales serán las que éste usará para identificarnos.

¿Qué pueden aportar a un banco?

Las aplicaciones de biometría de voz en el mundo Financiero no han hecho más que empezar. Quizás la aplicación con mejor retorno de inversión hoy en día es la de detección de fraude encall centers<. El uso de “listas negras” de voces de personas que ya han cometido fraude se puede usar para filtrar las llamadas entrantes. Esto está evitando de manera masiva la proliferación de bandas organizadas que usaban el call center para cometer fraudes o para obtener información con la que cometían fraude por otros canales.

La autenticación por voz, además de permitir reducir el fraude, hace la experiencia de usuario en el canal telefónico o móvil mucho más rápida y amigable.

¿Cómo?

Se pueden desplegar sistemas multicanal que combinen la autenticación en los distintos canales del Banco: telefónico, móvil, web, video-chat, redes sociales, etc. También puede usarse para la firma de documentos usando la voz. El cliente puede usar su voz para aceptar un contrato y esta voz convertida en huella vocal puede usarse como “firma” del mismo. De esta manera un cliente podría abrir una cuenta bancaria sin pasar por la sucursal, solo usando canal web y/o telefónico. Por supuesto muchos de estos avances deberán ir pasando por filtros regulatorios e ir acompañados de otros sistemas de seguridad y control. La presencia física al hacer una transacción normalmente usa la firma manuscrita como autenticación. Y en muchos casos incluye el cotejo con un documento de identificación con foto. Estos procedimientos, cuando la comparación se hace por personas que no son expertas en caligrafía o en reconocimiento de documentos, tienen también sus puntos débiles.

No existe, que yo sepa, una comparación de falsos positivos entre sistemas de presencia física y una modalidad biométrica, pero creo que nos llevaríamos alguna sorpresa. Sobre todo si se trata de ataques bien preparados.

¿Es muy difícil copiar la voz?

La voz se puede grabar y reproducirse luego para tratar de hacerse pasar por el usuario legítimo. Por ello las medidas contra estos ataques de grabación (anti-spoofing en el argot biométrico) son de gran importancia en cualquier implementación que no tenga un agente hablado con la persona en línea directa. Agnitio tiene varios sistemas patentados para defenderse de estos ataques usando tecnología muy sofisticada que detecta el ciclo grabación/reproducción frente al uso directo de la voz. Generar una voz como la de alguien de manera que se pueda engañar al sistema es al día de hoy imposible. Tanto los imitadores profesionales como los sistemas de síntesis de voz son fácilmente detectables por nuestro software.

¿Cree que ataques man-in-the-middle son más  peligrosos para los sistemas de voz - al ser más fácil obtener una muestra de voz que de otra parte del cuerpo-?

Out of band authentication). Usando una llamada telefónica breve por un teléfono acordado previamente y haciendo que el usuario diga alguna frase es la manera más cómoda y segura de hacer una autenticación out-of-band.

¿Los sistemas biométricos van a acabar con las contraseñas?

Yo estoy convencido de que las contraseñas ya tienen sus días contados. Al menos como herramienta fundamental de autenticación. Las empresas, los bancos, las tiendas online, no pueden seguir torturando a sus clientes haciéndoles recordar contraseñas seguras que deben cambiar frecuentemente. Hoy en día un usuario medio puede llegar a manejar más de 60 contraseñas, siendo 20 el promedio en un país europeo. Algunos estudios indican que de ellas unas 10 se usan diariamente. Y claro para mantenerlas seguras están deben ser largas, tener mayúsculas, minúsculas, símbolos y además ¡cambiarlas a menudo! Eso es imposible de mantener.

La biometría es sin duda una de las formas en que este problema va a resolverse. Vendrá ayudada de otras tecnologías de seguridad para asegurarnos que el proceso completo es seguro y que la seguridad está adecuadamente dimensionada a la información que protege. Pero estoy convencido de que más tarde o más temprano mantendremos quizás unas pocas contraseñas muy seguras que no tendremos que usar muy a menudo y que solo nos servirán como sistemas de respaldo para casos límites.

¿Cuáles son las ventajas de la verificación biométrica por voz con respecto a las contraseñas?

Las contraseñas son imposibles de recordar cuando son medianamente seguras. Y además son fáciles de robar o averiguar. Tienen lo peor de los dos mundos: incómodas y poco seguras. La verificación biométrica multimodal es a la vez cómoda para el usuario y tremendamente segura. Pudiéndose adaptar al entorno con flexibilidad.

¿Qué país está más adelantado?

El uso de biometría de voz en gobiernos está más adelantado en Europa que en Estados Unidos por diversos motivos históricos. Sin embargo en el sector financiero las implementaciones en Estados Unidos están más avanzadas.

¿Cuáles son los siguientes retos de Agnitio?

El reto más importante de cualquier empresa que lidera un sector tecnológico es mantenerse al frente. Como la Reina de Corazones en el cuento Alicia en el País de las Maravillas, que tenía que seguir corriendo para mantenerse donde estaba. Es decir el reto es continuar con una labor de Investigación en nuevos algoritmos que permita mejorar a la vez la precisión, la rapidez y el tamaño de los sistemas. Agnitio va por la cuarta generación de tecnología de Identificación por voz.

Estamos trabajando en la quinta generación que va a ser mucho más robusta al ruido ambiente, mejorará de manera espectacular la precisión en locuciones cortas y podrá aprender a reconocer al usuario muy rápidamente con el tiempo. Estos son algunos de los requisitos para una autenticación en los servicios en la nube que van a venir de manera masiva en los próximos años.