En nuestro último artículo, estuvimos explicando un caso práctico o tutorial en Pentaho Data Integration (PDI), concretamente el de cómo utilizar el apartado Input para importar datos desde una base de datos.
Como sabemos que las empresas necesitan analizar e interpretar correctamente toda la información y datos que se van generando para tomar mejores decisiones empresariales, es necesario contar o disponer de herramientas de Analítica Avanzada, Big Data o Business Intelligence de calidad que nos ayuden a llevar a cabo dicha tarea lo mejor posible.
Pentaho Data Integration es una de esas herramientas, se trata de la solución de Integración de Datos Open Source más utilizada en la actualidad, y uno de los componentes más importantes y útiles de Pentaho.
Por ello, en este artículo, queremos explicar otro de los procesos interesantes que podemos hacer en PDI, concretamente en su apartado “Input”, y es el de cómo obtener los nombres de las subcarpetas.
¿En qué consiste la función de “Obtener Nombres de Subcarpetas” (Get Subfolder Names)?
Básicamente se trata de decirle a la herramienta que lea una carpeta principal y devuelva todas las subcarpetas.
Pasos a realizar
Lo primero que tenemos que hacer es acceder a PDI. Una vez hayamos iniciado sesión, hacemos click en “New” y, posteriormente, en “Transformation”:
Después, seleccionamos el apartado “Input”, buscamos el proceso “Get Subfolder Names” y lo arrastramos al Panel:
Hacemos doble click en el proceso y se nos abrirá una pequeña ventana donde se nos pedirá que busquemos un archivo en directorio pulsando “Browse”:
Le damos a “Acepttar”, lo añadimos haciendo click en “Add” y le damos a “Ok”:
A continuación, para previsualizar los datos, pulsamos “Preview rows”, “Ok” y luego nos aparecerá una ventana con todas las subcarpetas del archivo del directorio que habíamos añadido previamente:
Y así en unos pocos pasos muy sencillos y rápidos hemos podido obtener los nombres de todas las subcarpetas de cualquier archivo del repositorio.