Review – Learning Pentaho Data Integration 8 CE

Dentro de nuestro Máster de Inteligencia de Negocio y Big Data, se hace uso de múltiples herramientas tanto propietarias como open source que cubren un amplio abanico de las necesidades de una organización.

Entre ellas Pentaho Data Integration (PDI). PDI es una herramienta de integración de datos, con foco en los procesos ETL (Extract-Transform-Load).

PDI es una herramienta muy versátil no solo aplicable en el contexto de inteligencia de negocio o big data, sino también en el desarrollo de aplicaciones, migración de sistemas o incluso data science!

Dominar este tipo de herramientas es cuestión de tiempo y práctica, principalmente por la gran cantidad de opciones y múltiples enfoques y posibilidades de optimizar los procesos ETL.

¿Cómo acelerar mi aprendizaje? A parte de cursar un programa,,… podemos revisar la documentación disponible, los ejemplos de incluye PDI, buscar videos de aficionados y  expertos,… o leer libros que recojan las últimas novedades sobre esta herramienta.

Hemos tenido la oportunidad de acceder y leer el último libro de Maria Carina Roldán llamado Learning Pentaho Data Integration 8 CE – Third Edition: An end-to-end guide to exploring, transforming, and integrating your data across multiple sources.

Es un libro muy interesante y sobretodo actualizado a la última versión de PDI (la 8). Por un lado, tiene una introducción a la herramienta (interfaz, funcionalidad básica, tipo de objetos que se pueden crear -transformaciones y trabajos-, variables, parámetros,…). Por otro, se centra en ejemplos fundamentales para los proyectos de integración de datos. Por citar algunas de ellos:

  • Acceso y lectura de diferentes fuentes de datos.
  • Limpieza de datos.
  • Carga de dimensiones
  • y muchos más.

Muchos de los ejemplos explicados son relevantes cuando estamos realizando un proyecto de integración de datos y el diseño del libro en formato recetas permita que se convierta en un libro de cabecera.

Tanto si uno se inicia como si es un experto, es posible encontrar secciones interesantes en este libro. Eso le da un punto a favor, puesto que no es tan solo un libro orientado a los que empiezan a trabajar con PDI.

Por lo que es una buen añadido a la colección de libros, sobretodo si se trabaja con PDI.

About Josep Curto Díaz

Josep Curto es el director académico del Máster en Inteligencia de Negocio y Big Data (MiB) de la UOC. Así mismo es director de Delfos Research, empresa especializada en investigación de los mercados de Business Intelligence, Business Analytics y Big Data.
This entry was posted in Data Integration, Pentaho and tagged , , . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *