¿ETqué? Sí, eso es lo que pensamos todos cuando escuchamos esto. ETL son las iniciales de Extract, Transform an Load, esto es, coger datos desde una fuente, transformarlos y volcarlos a otro soporte. ¿Y en qué consiste esto?, pues por ejemplo en coger los datos de un fichero Excel y cargarlos en un MySQL ¿aún pensáis que nunca habéis utilizado la ETL?
En muchos proyectos hay que realizar ETL, pero normalmente no tan sencillas como el ejemplo anterior, sino que debemos combinar datos de varias bases de datos, adaptarlos, mezclarlos y volcarlos a otra base de datos, interconectando distintas aplicaciones en la empresa, como por ejemplo pasando la lista de clientes de un CRM a un sistema de gestión de incidencias de forma periódica, etc.
Como “buenos” programadores, lo primero que se nos ocurre es tirarnos a picar código en nuestro lenguaje de programación favorito que haga estas integraciones de datos… si, yo también lo hice, aunque Frive ya me enseñara el Kettle en los maravillosos años de Shylex… El problema es que programarlo es muy propenso a errores y a la larga también más costoso en tiempo.
Con el Kettle, disponemos de una herramienta que nos permite definir estas transformaciones de forma gráfica, interconectando bloques que tienen diversas funciones. Es tremendamente versátil, ya que tenemos bloques que nos permiten leer y escribir de cualquier base de datos, fichero Excel o CVS, Access, etc. y otros que nos permiten operar con los campos renombrando, normalizando, calculando campos en función de otros, mapeando valores, realizando buśquedas auxiliares en bases de datos, normalizando/desnomalizando los datos de distintas filas en una sóla, etc, etc. Las transformaciones que se hacen con el Kettle se guardan en un fichero ktr que luego puede ser ejecutado desde línea de comandos o un fichero batch.
Ahora mismo o lo estoy usando para pasar datos de un sistema de contabilidad y una aplicación de control de producción a un ERP, y de momento no me he encontrado nada que no se pueda hacer con el Kettle, eso sí, hay un bloque que permite ejecutar código javascript dentro de las transformaciones y que estoy utilizando extensamente…
En fin, aprender a utilizar el Kettle lleva un par de días, pero a la larga ahorra mucho más trabajo, así que, una vez más hay que pensar un poco las cosas antes de tirarse al monte a picar código
.
Hola Alberto:
Estoy empezando con el uso del Kettle. Antes he usado Informatica Power Center, mi pregunta es hay algún sitio en castellano que explique como empezar a usarlo, necesito hacer un workflow de cargas, de base de datos oracle, fichero XML, Mysql a otra BD diferente de mi Datawarehouse, pero no se como en Kettle.
Un saludo
hola, tengo una pregunta y espero me puedas ayudar, estoy recibiendo una “autocapacitacion” en Dataware Houses, he leído mucha información al respecto, pero todavía no tengo claro el funcionamiento de las transoformación, es decir, el rol que juega cada transformación, uin filtro, un lookup, etc etc etc… no se si puedes decirme un lugar, o tu cuentes con ésta información.
Para ser mas específico estoy trabajando en Informatica Power centar, peor al fin y al cabo las transformaciones para, Kettle, informatica u otras aplicaciones tienen el mismo objetivo
gracias. y espero me puedas ayudar
hola soy muy novata con esta herramienta y me gustaria saber donde puedo sacar un buen manual, al poder ser en castellano, para usar esta herramienta.
Lo que necesito hacer con ella es hacer diferentes transformaciones a un fichero de texto, y por la web solo encuentro ejemplos de transformaciones de tablas.
gracias
en kettle no he podido hacer ciclos y ya le busque por todos lados, uso la version 3.0.
ademas que los filtros no funcioan
saludos
no he podido hacer que el repositorio se actualize automaticamente.
Hola:
Necesito que me ayude, tengo un problema con el kettle. Cuando trato de extraer datos de un archivo excel para realizar una transformación me sale este error:
2010/03/12 08:59:04 – Excel Input – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : Error initializing step [Excel Input]
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : Step [Excel Input.0] failed to initialize!
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : Preparing transformation execution failed
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : org.pentaho.di.core.exception.KettleException:
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : We failed to initialize at least one step. Execution can not begin!
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) :
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) :
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : at org.pentaho.di.trans.Trans.prepareExecution(Trans.java:677)
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : at org.pentaho.di.ui.spoon.trans.TransGraph$25.run(TransGraph.java:3192)
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : at java.lang.Thread.run(Unknown Source)
2010/03/12 08:59:04 – Muerte_persona – ERROR (version 3.2.0-GA, build 10572 from 2009-05-12 08.45.26 by buildguy) : Errors detected!
Lejos mejor es Talend ETL
Interesante, lo probaré en cuanto tenga ocasión. Gracias!