Un día en la vida de un desarrollador de integración de datos: Ejecutar, realizar pruebas y depurar [3.ª parte]

En esta entrega de Un día en la vida de un desarrollador de integración de datos vamos a hablar de cómo ejecutar procesos o tareas, realizar pruebas y depurar en Talend Studio. En el vídeo y en la información a continuación descubrirá dos formas distintas de ejecutar tareas, realizar pruebas con pequeños conjuntos de datos y utilizar funciones de registro para depurar, así como la función de depuración que lleva integrada Studio.

Método de depuración n.º 1

Aquí tenemos un proceso sencillo que lee datos de un archivo grande, los agrega y lo escribe en una tabla.

captura de pantalla de talend studio

Si va a la función Run (Ejecutar) de la pestaña y hace clic en Debug (Depurar), luego puede darle al botón Next (Siguiente), que creará la tarea y empezará a ejecutar el proceso. Puede ver cómo los datos experimentan cada transformación con todos los atributos.

Bien, el archivo tiene varias columnas y el tMap reduce esa cantidad. Ahora me interesa reducir el conjunto de datos para observar la transformación de un volumen menor de datos.

Por lo tanto, si hago clic en el componente del archivo, tengo un límite de campos y puedo especificar diez campos. Y ahora si vuelvo a hacer Run, Debug, Run (Ejecutar, Depurar, Ejecutar), podré ver todo el proceso con tan solo 10 registros haciendo clic en el botón Next (Siguiente) diez veces.

Y veré las funciones del atributo depuración siempre en todos los componentes. Los puedo arrastrar y mover, por lo que resulta fácil ver en realidad qué constaba escrito en la base de datos aquí. Y puedo ver la secuencia que se está generando en el tMap.

Método de depuración n.º 2

Otra forma de depurar el proceso consiste en añadir salida de pantalla a Studio con el componente tLogRow y vincular el resultado del último tMap al tLogRow.

De esta manera, solo estoy creando una nueva fila de salida en tMap a partir de la fila de salida. Si entro en tMap ahora puedo conectar los atributos que quiero que vayan a tLogRow en el tMap, o sea que basta con arrastrarlos y soltarlos aquí:

captura de pantalla de talend studio

Si necesita añadir la secuencia para asegurarse de que se esté generando correctamente, añada una columna nueva.

captura de pantalla de talend studio

Llámela seq, de secuencia en inglés. Y tiene que ser un entero, con lo que solo tengo que cambiarlo a int (integer, en inglés). Y luego añadir una función en el creador de expresiones, y además quiero añadir la secuencia numérica. Bien, de esta forma ahora tengo una secuencia lista para usar.

Si deseo ver los datos en un formato más bonito, en formato de tabla, también lo puedo cambiar. A lo mejor me interesa tener más filas para ver más resultados, pues lo cambio a 100 filas en el archivo. Y si lo ejecuto en modalidad ejecución normal, puedo ver todos los datos de salida que se están agregando en la pantalla junto con los números de secuencia.

Para obtener más información sobre estos dos métodos de depuración, eche un vistazo al vídeo de arriba. En el próximo tutorial aprenderemos funciones básicas de diseño.

| Last Updated: agosto 7th, 2019