Tal y como hemos visto en otros artículos del blog, Pentaho Data Integration (PDI) es un componente de Pentaho muy completo y útil que podemos aprovechar en nuestra empresa o negocio para diversas acciones.
En este artículo, explicaremos cómo importar datos desde un archivo Excel.
Como veremos a continuación, será tan sencillo como poner la ruta en dónde se encuentre dicho archivo y configurar las diferentes opciones que tenemos para extraer los datos que queramos.
En este ejemplo podemos observar un fichero Excel con varias columnas como Nombre, apellido,.., y una fila entre los datos que está vacía.
Dentro de Spoon, hacemos click en Input, buscamos el paso de Microsoft Excel Input y lo añadimos a la derecha.
Aquí tendremos que ubicar dónde se encuentra el archivo que vamos a cargar, seleccionando el tipo de hoja de cálculo que sea, y lo añadimos.
Tendremos a continuación que seleccionar la hoja dónde se encuentren los datos y marcaremos las casillas de cabecera y líneas vacías según nos interese:
Añadimos los campos y comprobamos que el tipo de datos sea correcto:
Previsualizamos y vemos si el resultado es el que debería ser. Dependiendo de la configuración anterior se mostrarán de una manera u otra.
Y así en unos pocos pasos hemos visto cómo utilizar el Input de Excel dentro de Pentaho Data Integration, una de las herramientas referencia en el Business Intelligence.