¿Qué quiere decir un bebé cuando llora?
Todo el que haya sido madre o padre ha pasado por esta situación: el bebé llora y llora y no sabemos por qué. ¿Tendrá hambre? ¿Tendrá sueño? Esto mismo se preguntaba Ana Laguna, científica de datos en BBVA Data & Analytics, cuando nació su primer hijo. Ana buscó una ‘app’ que le ayudara a entender el motivo por el que lloraba su bebé. Pero no tuvo éxito. Entonces pensó que, con técnicas de inteligencia artificial que aplica en su trabajo diario, podría traducir el llanto de su bebé para saber qué le pasa en cada momento.
Ahí arrancó su proyecto, para el que comenzó a grabar los audios del llanto de su recién nacido. Reunió un total de 65 audios entre el primer y el cuarto mes de vida del niño. “Como la mayoría de padres esperando un bebé, entre muchas de las preguntas que nos hacemos está la de ¿lo entenderé? Tras buscar ‘apps’ que me ayudasen a hacerlo y no encontrar resultados satisfactorios, me planteé el reto de intentar traducir los llantos de bebés”, explica Ana Laguna.
“No pude empezar a grabar hasta que estuve más cómoda y empecé a identificar el motivo por el que lloraba”, añade. Así, fue etiquetando cada uno de estos audios con la razón por la que se producían para crear una biblioteca de audios desde los que, gracias a un algoritmo, identificar distintos patrones que fueran útiles para otros padres en el futuro. “El algoritmo es una red neuronal artificial, que aprende de lo que tú le enseñes”, señala.
"En el pasado ya había trabajado en el campo de la traducción automática, y el llanto del bebé no deja de ser otro medio de comunicación oral del ser humano. Además, si Jane Goodall comprende el lenguaje del chimpancés, ¿por qué no intentar traducir las necesidades de un recién nacido usando un algoritmo de IA?", comenta Ana.
Con estos 65 audios, pudo identificar que su bebé lloraba fundamentalmente por cuatro motivos: hambre, sueño, dolor o necesidad de mimos, tal como muestran los patrones gráficos —o espectrogramas— que desarrolló al respecto.
Representación del llanto de un bebé en diversos patrones gráficos.
Tras este primer estudio, Ana observó que las señales de audio eran válidas, es decir, había diferencias que permitían distinguir entre distintos tipos de audio, y la precisión del modelo era aceptable. Sin embargo el tamaño del ‘dataset’ era insuficiente. “Para un algoritmo de estas características, el número de audios del que disponía en un primer momento era poco”, señala. Además el hecho de tener datos de un sólo bebé no valdría para generalizar, puesto que habría cierto sesgo. En resumen, el proyecto no ha hecho nada más que empezar. “Está en pañales y nunca mejor dicho”, afirma Ana.
Por ello, su prioridad principal ahora es conseguir más datos, y si es posible, ya etiquetados. ¿Por qué la prioridad principal es conseguir más datos? "El dato es nuestra piedra en bruto a pulir. Evidentemente, el resultado final diferirá dependiendo si la materia prima es un diamante o un cuarzo", dice Ana. La científica de datos resalta que el etiquetado es muy importante. “Este etiquetado”, explica, “debería estar hecho por los padres”, para poder atribuir un motivo a cada tipo de llanto que permita ampliar el patrón. La propia Ana prevé ampliar el ‘dataset’ con las grabaciones del llanto de su segundo bebé.
“Me interesa además conseguir variables como la nacionalidad o el sexo, porque según diferentes aspectos culturales presentes en el acento y entonación de la madre, el llanto del bebé varía dependiendo del origen de los padres. Por lo tanto, un algoritmo entrenado con bebés de otros países quizás no tuviese tan buena precisión entre niños españoles”, indica. Esto se denomina prosodia, una rama de la lingüística que analiza y representa formalmente aquellos elementos de la expresión oral tales como el acento, los tonos y la entonación.
Tener más base de datos de audios permitirá reevaluar el modelo con esos datos nuevos. Asimismo, Ana prevé seguir experimentando con otras técnicas de última generación, como el ‘machine learning’ para mejorar el algoritmo. Y de aquí, poder crear una ‘app’ o algoritmo al servicio de todos.
Ana afirma que “este tipo de aplicaciones no es solo útil para los padres, sino para cualquiera que cuide del bebé” — familiares o profesionales. En el futuro, se podría incluso detectar cambios en el llanto en función, por ejemplo, del tipo de dolor que registre el bebé o la diagnosis temprana de determinadas enfermedades.
Los datos al servicio del bien común
Ana trabaja dentro de un proyecto de ‘Data 4 Social Good’, para desarrollar proyectos sociales en los que se pueda aplicar la ciencia de datos. En esta web, ha incluido un formulario de colaboración a través del que los padres pueden remitir los audios de sus bebés. “Tienen que incluir la etiqueta con el motivo del llanto y la nacionalidad de los padres y el sexto del bebé”. Ahora mismo, Ana recibe una media de 10 audios al día.
Como el objetivo del estudio es detectar las necesidades primarias del recién nacido, los audios analizados van desde el primer al sexto mes de vida de los bebés. “Yo paré al cuarto mes, porque a partir del quinto mes noté que había diferencias en la señal de audio”. “Vamos a superar los 500 audios seguro”, dice Ana. “Con 1.000 audios ya tendría una base de datos suficiente para desarrollar un modelo fiable”, concluye.