Responsabilidad, confianza y calidad: los tres cimientos de los datos
Las empresas se enfrentan al desafío de interpretar correctamente la información para crear patrones válidos que puedan aplicar en sus negocios.
Las personas que siguieron en Twitter a la demócrata Hillary Clinton o al republicano Donald Trump durante la pasada campaña presidencial estadounidense fueron analizadas con lupa.
Desde las dos candidaturas, los equipos de comunicación exprimieron las analíticas de Twitter para conocer el nombre, la dirección de los seguidores y, si el perfil llevaba una fotografía, determinar el sexo, la edad y etnia de cada uno. Todo con el objetivo de personalizar lo máximo posible cada dirección de Twitter para acercarse más a los votantes o para realizar acciones con el objetivo de ganar un nuevo voto. Unos datos muy valiosos tanto en la lucha política como para cualquier empresa publicitaria.
No hubo grandes sorpresas: se vio que en cuanto a género los candidatos tenían más o menos el mismo número de seguidores y que, en el caso de Hillary, el porcentaje de seguidores hispanos era mucho más alto que el del actual presidente norteamericano.
El problema, como explicó Susanna Pirttikangas - senior researcher de la Universidad de Oulu y que participó en el evento de Machine Learning organizado por BigMl y Barrabés en Madrid- fue que el modelo definió que en el caso de Clinton los seguidores tenían un estatus social más bajo y en el caso de Trump más alto.
Para definir este patrón se determinó que las personas que tienen en Twitter más seguidores son de un estatus social más alto. “Me llamó la atención esta conclusión y por ello creo que hay cierta responsabilidad al interpretar los datos. Las empresas tienen que ser responsables y hay que crear modelos correctos para definir patrones. Si los modelos no son correctos, los resultados pueden no ser ciertos o conllevar algún tipo de discriminación o provocar que yerres completamente y te dirijas a un público equivocado”, explicó Pirttikangas.
El segundo pilar que destacó la investigadora para sacar el mejor partido a los datos es la confianza. La científica de datos, que trabaja en la universidad de Oulu - la ciudad de cerca de 200.000 habitantes conocida como la Silicon Valley polar-, puso de ejemplo un proyecto que realizaron desde la universidad para crear una ciudad inteligente. “No nos conformamos con los datos de una sola fuente. Queremos mezclarlos todos”, apuntó.
Por ello, realizaron un modelo con datos que les proporcionaban diferentes empresas. Por un lado utilizaron dispositivos de geolocalización para conocer la velocidad y la distancia entre los vehículos y, por otro, se asociaron con una empresa de meteorología para obtener información del tiempo.
Conocer la previsión meteorológica les permitió saber si, por ejemplo, el suelo estaba resbaladizo, un dato crucial para evitar accidentes, pues permite calcular la distancia correcta entre los vehículos y evitar los choques. “Es bueno experimentar. En este caso se ven las oportunidades de negocio de dos empresas que comparten datos para crear dispositivos que ayudan a la conducción”, señaló.
La especialista incidió en que si se comparten datos se realizan predicciones correctas. Por ello, animó a que las empresas tuvieran la confianza de participar en proyectos comunes en donde la mezcla de información suponga mejoras para la sociedad y también modelos de negocio y oportunidades para ellas.
Sobre el big data, Pirttikangas destacó además las posibilidades que dan su variedad, velocidad y volumen: “En 10 años no teníamos la capacidad de interpretar datos en tiempo real. Ahora sí y hay que aprovecharla”. El desafío, según la especialista, es “lidiar con la variedad. ¿Cómo hay que analizar toda la información para explotar los datos del internet de las cosas?”, se preguntó.
La clave es la suma de la responsabilidad y de la confianza que lleva a la calidad, según Pirttikangas. Los tres pilares sobre los que hay que construir los modelos para interpretar correctamente los datos.