Buscar
Cerrar este cuadro de búsqueda.
Buscar
Cerrar este cuadro de búsqueda.
Business Intelligence, Big Data, Pentaho y Curie Platform

Spoon, el componente de Pentaho Data Integration (Kettle)

academy@itop.es
Compartir:

La tecnología es el motor que cambia el mundo. De eso no hay ninguna duda. Y es por ello por lo que las empresas necesitan y deben actualizarse, implementando nuevas soluciones o herramientas tecnológicas que faciliten su trabajo.

Te mostramos las utilidades de esta herramienta con un caso práctico

Una de estas herramientas muy potentes es Pentaho, un software de Gestión de Inteligencia Empresarial (Business Intelligence y Big Data) que permite la mejora de la toma de decisiones, gracias a su capacidad de generar cuadros de mandos, analíticas y mucho más.

Uno de los componentes de Pentaho, es Pentaho Data Integration (PDI) -también llamado Kettle– el cual contiene, a su vez, componentes muy interesantes como Spoon, que convierten a Pentaho en una herramienta muy útil y completa, tal y como pudimos ver en el anterior caso práctico.

Gracias a Spoon vamos a poder realizar procesos de ETL de manera fácil y rápida. En concreto, nos va a permitir hacer Data Warehouse, con estructura en Estrella, pudiendo formar las tablas de Hechos y Dimensiones y sus relaciones entre ellas sin ninguna dificultad.

Prácticamente nos va a permitir hacer de todo: crear conexiones a los datos, hacer todo tipo de transformaciones, insertar fórmulas, transformaciones directas ya implementadas gracias a su calculadora… Sencillamente en pocos pasos te permite hacer muchas cosas sin tener que programar directamente con código.

Para ver cuán interesante es esta herramienta, os mostraremos en este artículo el siguiente caso práctico en Spoon:

En este imagen, podemos ver el panel de Spoon con los diferentes procesos que podemos realizar, los cuales tendremos que ir arrastrando hacia la pestaña creada. En esta pestaña, si os fijáis, podremos darle a “Play”, “Pause” o “Stop” cuando queramos iniciar la transformación, pausarla o pararla.

En este caso, hemos decidido escoger los siguientes procesos para crear un Data Warehouse, es decir, una tabla con fechas:

  • Generate Rows: para generar las columnas.
  • Add sequence: añadir una secuencia.
  • Calculadora: para realizar una fórmula con esos datos.
  • Select values: para seleccionar los valores que escojamos.
  • Búsqueda/actualización en combinación: para actualizar los datos automáticamente.

1º Paso: Generate Rows

En nuestro caso práctico, el primer paso es generar las columnas. Aquí hemos especificado que el límite sea de 6000 y que la primera columna del primer día, todas estén con la fecha 01-01-2015.

Te recomendamos leer nuestro artículo “Cómo generar un Data Grid y columnas en Pentaho Data Integration (PDI)” para saber más sobre este proceso.

2º Paso: Add Sequence

El siguiente paso es “Add sequence”, es decir, vamos a añadir una columna que tendrá cualquier nombre y con la secuencia de 1 en 1, con lo cual empieza en 0 e incrementa en 1:

Y el resultado de los datos sería este:

Te recomendamos leer nuestro artículo “¿Cómo añadir constantes y secuencias en Pentaho?” para saber más sobre este proceso.

3º Paso: Calculadora

Ahora pasaremos a la calculadora directamente, una herramienta muy interesante ya que tiene miles de fórmulas, como podemos ver en la imagen siguiente:

Para este caso concreto, utilizaremos varias fórmulas para trabajar con los datos. Como podemos ver en la imagen de debajo, sumaremos 1 al “first_day” y todo lo de la calculadora:

Previsualización de los datos:

Te recomendamos leer nuestro artículo “¿Cómo usar la función Calculator en Pentaho Data Integration (PDI)?” para saber más sobre este proceso.

4º Paso: Select Values

Aquí seleccionaremos los valores con los que nos quedamos y los que no:

5º Paso: Búsqueda/actualización en combinación

El último paso sería la actualización. Esto es por si cambia algo para que se actualice y no se añada ninguna línea más.

Y este sería la tabla final, a la cual hemos añadido el “pk_tiempo” para relacionar la fecha. Esto servirá, por ejemplo, para cuando tengamos una factura o evento de una fecha determinada, dicha fecha corresponde a un determinado pk, con lo cual cuando crucemos los datos, nos quedaremos con la cifra del pk sin tener que meter todos los datos:

Como hemos visto, Spoon, de Pentaho Data Integration (PDI), tiene muchas utilidades en el ámbito empresarial, una gran herramienta para tomar los datos, hacer las transformaciones necesarias con las que dejar los datos de una manera muy fácil de analizar y visualizar.

Por ello, la recomendamos encarecidamente ya que, una vez se aprende a usarla, se hace todo de manera muy rápida y ágil.

¿Te gustaría aprender más sobre Pentaho? Accede a nuestros cursos:

¿Quieres ponerte en contacto con nosotros?
Si necesitas ayuda, más información o te gustaría realizar alguna consulta.

Artículos relacionados

¡Mantente al día con nuestra newsletter!​

Deja un comentario

¡5 DÍAS LÍMITE!

Del 10 al 14 de Abril

Cursos SAP Business One al 50% de descuento​

Días
Horas
Mins