Wednesday, November 22, 2017
Integración de datos

Talend Open Studio : Componentes básicos

>helibertoarias helibertoarias
octubre 17, 2013

En la entrada Primeros pasos con Talent : Importando datos se explico paso a paso como se configuraran dos fuentes de datos, una para extraer información de una base de datos y otra para almacenar la información extraída. Adicionalmente se presentaron los pasos requeridos para extraer los metadatos desde las conexiones creadas y como imprimir en consola la información procesa. En la próximas entradas veremos ejemplos de uso de los componentes básicos para la manipulación de datos cuando trabajemos con la herramienta Talend Open Studio. Mientras le comparto algunos de los características de estos componentes.

Grupo Componente Descripción
Database/SQL Server tMSSqlInput tMSSqlInput : Permite extraer información desde una base de datos SQL Server. De igual manera existen controles como tMySqlInput para MySql,PosgresSql para Postgres y demas base de datos. Ver ejemplo.
tMSSqlOutput tMSSqlOutPut : Permite ingresar/actualizar información a una base de datos SQL Server. Adicionalmente permite eliminar y recrear la tabla. De igual manera existen controles como tMySqlOuput para MySql, tPostgresSqlOutput para postgrest y una gran variedad de base de datos.
tMSSqlLasInsertId tMSSqlLastInsertId :Retorna el ultimo Identity creado en la conexión. Este componente retorna el @@Identity.
Processing tAggregateRow tAggregateRow : Permite en un flujo de datos realizar agrupamiento GROUP BY por una o más columnas. Esta operación permite realizar calculos de MIN, MAX, SUM etc.
tNormalize tNormalize : Permite en un flujo de datos generar varios item a partir de un array o de una cadena de texto con separadores.
tDenormalize tDenormalize : Permite en un flujo de datos concatenar varios campos en un array o en cadenas de texto con separadores.
tMap tMap : Permite realizar operaciones de mapeo, transformaciones de datos como unir los valores de dos columnas y almacenarlos como una sola. También permite realizar JOIN’S, filtrar datos. A este control se le pueden enlazar varios controles de tipo tMSSqlInput y generar varios salidas que puede se utilizar en varias operaciones.
tFilterRow tFilterRow : Permite en un flujo de datos aplicar filtros por varias columnas haciendo uso de los operadores && y || con las condiciones de !=,==,<=,<,>=, >.
tSortRow tSortRow : Permite en un flujo de datos realizar tareas de ordenamiento de manera ascendente por tipos de datos alfanuméricos, numéricos o fecha en una o mas columnas.
tReplace tReplace : En un flujo de datos permite reemplazar entradas de datos de acuerdo a coincidencias parciales, totales, discriminando por mayúsculas minúsculas o haciendo uso de expresiones regulares generando un nuevo valor en la columna de salida.
Orchestration tReplicate tReplicate : Permite replicar varias veces una salida de datos tantas veces como sea necesario.
Custom code tJava tJava : Permite agregar código Java en el que de realicen operaciones como aplicar formatos de fecha, invocar métodos creados en las rutinas. Permitiendo reutilizar código en varios Jobs.
Logs & Errors tLogRow tLogRow : Permite imprimir por consola un flujo de datos durante la ejecución.
(Visitado 787 veces, 5 visitas hoy)
Heliberto Arias
Mi nombre es Heliberto Arias y vivo en Barranquilla, Colombia. Soy desarrollador de software. He estado en el desarrollo de software desde el 2007. Cree este blog en 2013 para compartir lo que voy aprendiendo cada año y en el escribo de tecnologías Microsoft principalmente en C# (y aunque he usado VB declaro que lo detesto) y SQL Server desarrollado aplicaciones y servicios web entre otro s.Me gustaría mucho si te suscribes a mis redes en Youtube, Google+, Twitter, e Instagram.

Comments

  • Francisco Gómez
    Francisco Gómez

    Hola,

    Tengo dos columnas de String, quisiera saber con TMap cómo unirlas como una sola columna, para poder saber las palabras repetidas con un TUniqRow,

    Espero puedas ayudarme, Gracias!

    May 17, 2014, 5:26 pm
    Responder
  • Mauro
    Mauro

    Muy buen aporte, espero leer más sobre Talend… estoy comenzando a dar los primeros pasos y se ve genial

    Gracias nuevamente!!!

    Sep 11, 2014, 5:44 pm
    Responder
  • Pedro Gallardo
    Pedro Gallardo

    Estimados, necesito hacer algo más complejo, se trata de validaciones desde la carga, formatos, y si en un mismo registro (entendiendo que es un cvs, cada linea un registro), se cumplen algunas dependencias, por ejemplo, que el código de la ciudad pertenezca al de la región y que el de la región pertenezca al país. No se si se puede hacer esto desde la carga, en el entendido de que lo que tengo como insumo es un archivo .csv.

    atento a sus comentarios y gracias

    Mar 24, 2015, 9:16 pm
    Responder
  • Luis Tenorio
    Luis Tenorio

    Tengo dos columnas de String, quisiera saber con TMap cómo obtener los datos distintos entre las dos columnas, las diferencias

    Espero puedas ayudarme, Gracias!

    Abr 29, 2016, 5:54 pm
    Responder

Leave a Comment

Your email address will not be published.

18 − 14 =

Login
Remember me
Lost your Password?
Password Reset
Login