Tal y como hemos visto en otros artículos del blog, Pentaho Data Integration (PDI) es un componente de Pentaho muy completo y útil que podemos aprovechar en nuestra empresa o negocio para diversas acciones.

En este artículo, explicaremos cómo importar datos desde un archivo Excel.

Como veremos a continuación, será tan sencillo como poner la ruta en dónde se encuentre dicho archivo y configurar las diferentes opciones que tenemos para extraer los datos que queramos.

En este ejemplo podemos observar un fichero Excel con varias columnas como Nombre, apellido,.., y una fila entre los datos que está vacía.

Tabla Excel para importar a Pentaho

Dentro de Spoon, hacemos click en Input, buscamos el paso de Microsoft Excel Input y lo añadimos a la derecha.

Input Excel en Spoon Pentaho

Aquí tendremos que ubicar dónde se encuentra el archivo que vamos a cargar, seleccionando el tipo de hoja de cálculo que sea, y lo añadimos.

Cargar Excel en Pentaho

Tendremos a continuación que seleccionar la hoja dónde se encuentren los datos y marcaremos las casillas de cabecera y líneas vacías según nos interese:

Opciones Excel Pentaho

Añadimos los campos y comprobamos que el tipo de datos sea correcto:

Tipo de datos Excel en Spoon Pentaho

Previsualizamos y vemos si el resultado es el que debería ser. Dependiendo de la configuración anterior se mostrarán de una manera u otra.

Previsualizar datos Excel en Spoon Pentaho

Y así en unos pocos pasos hemos visto cómo utilizar el Input de Excel dentro de Pentaho Data Integration, una de las herramientas referencia en el Business Intelligence.

¿Te gustaría aprender más sobre Pentaho? Accede a nuestros cursos: