como-obtener-nombres-subcarpetas-pentaho-data-integration-pdi

Cómo obtener nombres de subcarpetas en Pentaho Data Integration (PDI)

paulamartin@itop.es

En nuestro último artículo, estuvimos explicando un caso práctico o tutorial en Pentaho Data Integration (PDI), concretamente el de cómo utilizar el apartado Input para importar datos desde una base de datos.

En nuestro último artículo, estuvimos explicando un caso práctico o tutorial en Pentaho Data Integration (PDI), concretamente el de cómo utilizar el apartado Input para importar datos desde una base de datos.

Como sabemos que las empresas necesitan analizar e interpretar correctamente toda la información y datos que se van generando para tomar mejores decisiones empresariales, es necesario contar o disponer de herramientas de Analítica Avanzada, Big Data o Business Intelligence de calidad que nos ayuden a llevar a cabo dicha tarea lo mejor posible.

Pentaho Data Integration es una de esas herramientas, se trata de la solución de Integración de Datos Open Source más utilizada en la actualidad, y uno de los componentes más importantes y útiles de Pentaho.

Por ello, en este artículo, queremos explicar otro de los procesos interesantes que podemos hacer en PDI, concretamente en su apartado “Input”, y es el de cómo obtener los nombres de las subcarpetas.

¿En qué consiste la función de “Obtener Nombres de Subcarpetas” (Get Subfolder Names)?

Básicamente se trata de decirle a la herramienta que lea una carpeta principal y devuelva todas las subcarpetas.

Pasos a realizar 

Lo primero que tenemos que hacer es acceder a PDI. Una vez hayamos iniciado sesión, hacemos click en “New” y, posteriormente, en “Transformation”:

Después, seleccionamos el apartado “Input”, buscamos el proceso “Get Subfolder Names” y lo arrastramos al Panel:

Hacemos doble click en el proceso y se nos abrirá una pequeña ventana donde se nos pedirá que busquemos un archivo en directorio pulsando “Browse”:

Le damos a “Acepttar”, lo añadimos haciendo click en “Add” y le damos a “Ok”:

 

A continuación, para previsualizar los datos, pulsamos “Preview rows”, “Ok” y luego nos aparecerá una ventana con todas las subcarpetas del archivo del directorio que habíamos añadido previamente:

Y así en unos pocos pasos muy sencillos y rápidos hemos podido obtener los nombres de todas las subcarpetas de cualquier archivo del repositorio. 

¿Tienes dudas o te gustaría aprender más sobre PDI o Pentaho? Accede a nuestros cursos.

 

Compartir:

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp

Deja un comentario

¿Quieres estar al día de nuestros cursos y formación en tecnología?

Anímate y únete a nuestra newsletter