Perfiles y roles profesionales

Actualmente existe un conjunto de perfiles que trabajan en entornos de inteligencia de negocio, análisis de datos, ciencia de datos y otras áreas relacionadas, que no están claramente definidos en el mercado ni en la academia.

El auge tecnólogico relacionado con todos los campos de inteligencia artificial y, en concreto, relacionados con el análisis y ciencia de los datos ha propiciado cierta confusión en la definición de los roles profesionales de estos nuevos perfiles profesionales.

A grandes rasgos, podemos definir 5 perfiles principales:

Los managers o consultores de business intelligence (Inteligencia de negocio o BI), business analytics (BA) o Big Data son profesionales que se encargan de la gestión de proyectos relacionados con el desarrollo e implantación de proyectos de BI, BA o Big Data, respectivamente.

Entre sus tareas principales se encuentra la gestión de proyectos y sus recursos asociados. Como tal, deben conocer especialmente el negocio, los proveedores, los clientes y la tecnología que están empleando sus equipos de trabajo.

En general, aunque este es un matiz muy fino, el consultor es quién se encarga de la creación y coordinación de los equipos que realizan la implementación de los proyectos, bajo la dirección del manager, que se encarga de las relaciones con proveedores, contrataciones, gestión de partners, control de presupuesto, etc.

Podemos decir que a nivel de formación son perfiles similares, aunque las tareas que desempeñan no son las mismas.

El analista de datos (data analyst) es un profesional que se dedica, principalmente, al reporting, desarrollo de dashboards, análisis mediante técnicas OLAP y otras herramientas de minería de datos. Realizan tareas de BI y BA con soluciones empaquetadas, es decir, productos empaquetados que realizan los procesos de análisis. A veces se conoce a estas herramientas como “cajas negras”, debido a que no puedes acceder al detalle de los métodos y algoritmos subyacentes. Quedan fuera de sus tareas, y en muchos casos, de sus conocimientos, los detalles de implementación y parametrización (fine-tunning) de los métodos y algoritmos que utilizan.

El científico de datos o data scientist es un perfil de reciente creación, hasta hace unos pocos años no se hablaba de este perfil ni en la industria ni en la academia. Este perfil presenta un nivel de conocimientos superior al del analista de datos, pudiendo realizar sus mismas tareas, pero con un nivel de profundidad superior a nivel de conocimientos matemáticos y de programación, que les permiten conocer los detalles de implementación de los métodos y algoritmos de minería de datos y machine learning.

Los científicos de datos se dedican a resolver problemas con casuísticas complejas, muchas veces de problemas adhoc que requieren un análisis y dedicación profundo. Deben de ser capaces de hacer investigación y conocer el estado del arte en los temas de minería de datos y machine learning, ya que la optimización de los algoritmos mediante la parametrización (fine-tunning) es una de sus responsabilidades.

Por otro lado, tenemos el arquitecto o ingeniero de datos (data architect o data engineer), que se encarga del diseño de la estructura de los datos y de los procesos de extracción, transformación y carga de los datos (procesos ETL).

Trabajan, tradicionalmente, con bases de datos analíticas o data warehouses, aunque recientemente se ha ampliado el catálogo con las nuevas bases de datos derivadas de los almacenes de datos, como por ejemplo data lakes, data marts, etc.

Cuando el ingeniero de datos se dedica a diseñar, implementar y mantener infraestructura relacionada con sistemas de Big Data, se llama arquitecto o ingeniero de Big Data. En este caso, su trabajo se centra en el diseño, creación y mantenimiento de clusters de procesamiento distribuido, como por ejemplo Apache Hadoop, Apache Spark o Apache Flink, y sistemas de almacenamiento distribuido de datos, como por ejemplo el sistema de ficheros distribuido HDFS o las bases de datos NoSQL.