Cómo obtener nombres de subcarpetas en Pentaho Data Integration (PDI)

paulamartin@itop.es
como-obtener-nombres-subcarpetas-pentaho-data-integration-pdi
Compartir

En nuestro último artículo, estuvimos explicando un caso práctico o tutorial en Pentaho Data Integration (PDI), concretamente el de cómo utilizar el apartado Input para importar datos desde una base de datos.

Como sabemos que las empresas necesitan analizar e interpretar correctamente toda la información y datos que se van generando para tomar mejores decisiones empresariales, es necesario contar o disponer de herramientas de Analítica Avanzada, Big Data o Business Intelligence de calidad que nos ayuden a llevar a cabo dicha tarea lo mejor posible.

Pentaho Data Integration es una de esas herramientas, se trata de la solución de Integración de Datos Open Source más utilizada en la actualidad, y uno de los componentes más importantes y útiles de Pentaho.

Por ello, en este artículo, queremos explicar otro de los procesos interesantes que podemos hacer en PDI, concretamente en su apartado «Input», y es el de cómo obtener los nombres de las subcarpetas.

¿En qué consiste la función de «Obtener Nombres de Subcarpetas» (Get Subfolder Names)?

Básicamente se trata de decirle a la herramienta que lea una carpeta principal y devuelva todas las subcarpetas.

Pasos a realizar

Lo primero que tenemos que hacer es acceder a PDI. Una vez hayamos iniciado sesión, hacemos click en «New» y, posteriormente, en «Transformation»:

Después, seleccionamos el apartado «Input», buscamos el proceso «Get Subfolder Names» y lo arrastramos al Panel:

Hacemos doble click en el proceso y se nos abrirá una pequeña ventana donde se nos pedirá que busquemos un archivo en directorio pulsando «Browse»:

Le damos a «Acepttar», lo añadimos haciendo click en «Add» y le damos a «Ok»:

 

A continuación, para previsualizar los datos, pulsamos «Preview rows», «Ok» y luego nos aparecerá una ventana con todas las subcarpetas del archivo del directorio que habíamos añadido previamente:

Y así en unos pocos pasos muy sencillos y rápidos hemos podido obtener los nombres de todas las subcarpetas de cualquier archivo del repositorio. 

¿Tienes dudas o te gustaría aprender más sobre PDI o Pentaho? Accede a nuestros cursos:

¿Quieres ponerte en contacto con nosotros?
Si necesitas ayuda, más información o te gustaría realizar alguna consulta.

Artículos relacionados

Como añadir constantes y secuencias en Pentaho
Business Intelligence, Big Data, Pentaho y Curie Platform

¿Cómo añadir constantes y secuencias en Pentaho?

Como hemos visto en anteriores artículos, Pentaho Data Integration (PDI) es un componente de Pentaho muy completo y útil que

Crear visualizaciones en Superset
Business Intelligence, Big Data, Pentaho y Curie Platform

¿Cómo crear visualizaciones en Superset?

La última ocasión estuvimos explicando uno de los procesos que se pueden realizar en la herramienta de Business Intelligence Apache

¡Mantente al día con nuestra newsletter!​

Deja un comentario

¿Quieres estar al día de nuestros cursos y formación en tecnología?

Anímate y únete a nuestra newsletter