Filtrar datos con el componente tMap

En este tutorial descubrirá el componente tMap y su interfaz, y aprenderá a utilizarlo para filtrar columnas desde un esquema.

Este tutorial utiliza la versión 6 de Talend Open Studio for Data Integration.

1. Cree una nueva Tarea, añada los metadatos de "movies" (películas) como fuente de entrada y añada un componente tMap.

  1. Cree una nueva Tarea estándar y llámela tMapFilter.
  2. Añada el archivo de metadatos de películas como componente delimitado de entrada.
  3. Añada un componente tMap que pueda modificar el esquema y filtrar columnas.
  4. Cree un flujo de datos a partir del componente "movies" hacia tMap_1 vinculando los dos componentes.

2. Configure el componente tMap_1 para filtrar columnas

  1. Haga doble clic en el componente tMap_1.
    La ventana del asistente de tMap_1 tiene cuatro apartados principales:

    - El apartado de la izquierda muestra los flujos de datos entrantes. Fíjese que puede haber varias entradas al componente tMap.
    - El apartado del centro muestra los vínculos de mapeo entre los flujos de datos de entrada y de salida. Aquí también puede crear variables que utilicen valores de entrada y que luego se utilicen para producir los de salida.
    - El apartado de la derecha muestra los flujos de datos de salida.
    - El apartado de abajo es el Editor de esquemas, que puede utilizarse para modificar el esquema de un flujo de entrada o de salida. Para editar un Esquema, seleccione el flujo de entrada/salida del esquema que desea cambiar (el flujo seleccionado aparecerá resaltado en amarillo) y edítelo en el Editor de esquemas.
    .
  2. Para crear un nuevo componente de salida, en la sección de salida del asistente de tMap_1 haga clic en el botón [+], dele el nombre filteredOutput al valor resultante y haga clic en OK. Se habrá creado un valor de salida vacío.
  3. Para añadir columnas al valor de salida, en el Editor de esquemas del mismo haga clic en el icono [+].
  4. Defina una columna para el ID de película (Column: movieID, Type: Integer (Entero) y Length: 4.
    Aviso: El nombre de la columna de salida no tiene por qué ser el mismo que el de entrada. Para cambiar el nombre de columna, modifique la entrada en el Editor de esquemas.
  5. Para enviar los datos desde la columna movieID del archivo de entrada a la columna de salida, haga clic en movieID, manténgala pulsada y arrástrela a la columna Expression de filteredOutput. Aparecerá una flecha amarilla que le mostrará el flujo de los datos.
  6. Para añadir las columnas title (título) y releaseYear (año de estreno) al componente de salida y vincularlos, seleccione y arrastre las columnas desde el componente de entrada al de salida.
  7. Para cambiar el orden de las columnas en el componente de salida, haga clic en los iconos [↑] o [↓]. Se actualizarán el orden de las columnas y los vínculos correspondientes.

3. Utilice el componente tMap_1 configurado.

  1. Para mostrar el valor de salida procesado por el componente tMap_1, añada un componente tLogRow al Diseñador de tareas y vincule el valor de salida filteredOutput del componente tMap_1 al componente tLogRow_1.
  2. Para ejecutar la Tarea, en la vista Run (Ejecutar) haga clic en Run.

Tan solo aparecerán los datos de películas filtrados (movieID, releaseYear y title).