Científico de datos vs ingeniero de datos: ¿en qué se diferencian?
Mientras que los científicos de datos seleccionan y analizan la información, los ingenieros de datos crean productos o soluciones de ‘software’ y destacan por sus amplios conocimientos sobre programación. La demanda de ambos perfiles, que trabajan de forma conjunta, ha aumentado de forma exponencial en los últimos años.
En la era de los datos, a muchas compañías les resulta complicado identificar y reclutar el talento que necesitan. Grandes consultoras como McKinsey, Gartner y Deloitte subrayan que centenares de empresas deberían implementar de forma urgente la ciencia y el análisis de datos para mejorar las estrategias comerciales. Es precisamente ahí donde juegan un papel fundamental los científicos y los analistas de datos. Pero, ¿en qué se diferencian exactamente ambos perfiles?
La diferencia principal entre los científicos y los ingenieros de datos
“Las organizaciones necesitan desesperadamente intelectuales de datos y líderes de datos que los ayuden a convertir los datos en un combustible para el crecimiento”, afirman desde el Consejo de Ciencias de Datos de América (DASCA). Sergio-Nabil Khayyat Arranz, arquitecto de Datos y director de Ingeniería y Arquitectura de datos en el Instituto de Ingeniería del Conocimiento (IIC), explica que, originariamente, cualquiera que trabajara con datos era científico de datos. Pero esto ha ido cambiando y poco a poco se han ido designando otros perfiles con tareas más específicas, como el ingeniero de datos.
El científico de datos se centra en una labor de investigación y análisis de los datos: “Es un trabajo que se enfoca mucho en el ensayo y error, probando cosas con los datos, construyendo modelos y desarrollando algoritmos hasta dar con aquello que funciona”. Por otro lado, la figura del ingeniero de datos surge en un momento de madurez del trabajo con datos, cuando las empresas se dieron cuenta de que necesitaban que esas pruebas o experimentos se convirtieran en productos o soluciones de ‘software’ con valor para el negocio. De su creación e implementación se ocupan los ingenieros, combinando distintos marcos y tecnologías.
¿Cuál es la labor de cada uno?
Los científicos de datos se encargan de manejar y analizar los datos en bruto para convertirlos en información y extraer conclusiones. También se ocupan del desarrollo de modelos predictivos que después se transformarán en soluciones. Khayyat subraya que la ciencia de datos tiene mucho que ver actualmente con el ‘machine learning’. Por eso, existen perfiles más específicos bajo el paraguas del científico de datos: de los ingenieros de aprendizaje automático a los ingenieros de modelos predictivos.
Mientras tanto, el ingeniero de datos se encuentra entre el científico de datos y el desarrollador de ‘software’. “Es un perfil que entiende cómo se trabajan los datos y a la vez cómo se construye el ‘software’ para hacer de puente y aterrizar los prototipos en productos, garantizando que los datos se puedan explotar con éxito”, comenta el experto. Entre sus tareas principales, también está el escalado de aplicaciones y soluciones en entornos reales de datos para lograr una implementación adecuada en el negocio.
¿Qué habilidades y formación necesita cada perfil?
Tanto los científicos como los ingenieros de datos son perfiles profesionales que forman parte del equipo multidisciplinar que se necesita para desarrollar soluciones de inteligencia artificial que aporten valor real a un negocio, como las que por ejemplo desarrolla BBVA AI Factory para las distintas áreas de negocio del banco.
El hecho de que el punto central de ambos perfiles sea el trabajo con datos hace que requieran una serie de herramientas y un lenguaje común. Además, poseer un mínimo de los conocimientos propios de la otra disciplina ayuda enormemente al éxito de los proyectos.
Pero hay algunas diferencias entre la formación y las competencias que necesita cada uno de estos perfiles. Los científicos de datos, según Khayyat, suelen tener cierta carga de matemáticas y estadística, que es la base de la inteligencia artificial. Además, están habituados a trabajar con ‘software’ de visualización de datos y librerías hechas en el lenguaje de programación Python. Las estadísticas y el aprendizaje automático juegan un papel central en la ciencia de datos. Así lo indica la Asociación Estadounidense de Estadística: “Enmarcar preguntas estadísticamente nos permite aprovechar los recursos de datos para extraer conocimiento y obtener mejores respuestas”.
Los ingenieros de datos, por su parte, tienen una buena base de programación y conocimientos de desarrollo de ‘software’. Más que con librerías, trabajan con tecnologías y herramientas. “Utilizan ‘frameworks’ como Spark (un marco de aplicación web de ‘software’ libre y de código abierto) para el tratamiento masivo de datos y tecnologías como Docker o Kubernetes para empaquetar aplicaciones y ponerlas en marcha de una manera fiable”, cuenta el experto. También usan tecnologías ‘cloud’, o de computación en la nube, que son útiles para el despliegue y escalado de las soluciones.
La demanda de ambos perfiles en el mercado laboral
La demanda de los perfiles de datos ha crecido notablemente en los últimos años. “Ambos son necesarios en la actualidad”, asegura Khayyat. Dos tercios de las compañías que apuestan por la inteligencia artificial afirman que seguirán aumentando su inversión durante los próximos tres años, según el informe El Estado de Inteligencia Artificial 2021, realizado por McKinsey. Todas estas empresas buscan soluciones reales y adaptadas a cada caso. De ellas se ocupan, en gran parte, los ingenieros de datos. Pero este trabajo se debe complementar con la investigación y análisis previo de los datos que realiza el científico de datos.
Ambos perfiles suelen trabajar en tándem. Por norma general, “el científico de datos descubre y prototipa una nueva forma de extraer valor de los datos y traspasa este conocimiento generado a un ingeniero de datos”. Este último se encarga de convertir dicha prueba de concepto en una solución completa. Por lo tanto, dependerá de cada caso y proyecto concreto el determinar cuáles son los perfiles más adecuados para cada equipo.
Hay que tener en cuenta que la distinción entre científico e ingeniero de datos es relativamente reciente. Algo que, según Khayyat, puede generar cierta confusión tanto en los perfiles profesionales como en las demandas de empleo. “Sin embargo, a medida que vemos cómo el sector madura, observamos una tendencia hacia una mayor demanda de ingenieros de datos (antes también considerados científicos de datos) con el fin de hacer realidad las soluciones”, afirma.