Configurar combinaciones en tMap

En este tutorial aprenderá a configurar los archivos de salida de una combinación en un componente tMap.

Este tutorial utiliza la versión 6 de Talend Open Studio Data Integration.

1. Configure el modelo de combinación

  1. En la Tarea jointMap, para abrir el asistente del componente tMap haga doble clic en el componente tMap_1.

    Aviso: Al hacer clic en el botón de ajustes de tMap se mostrará una lista de parámetros para configurar sus flujos de entrada y salida. Uno de los ajustes disponibles para los flujos de entrada le permite cambiar el Join Model (Modelo de combinación) de la opción por defecto "Left Outer Join" (Combinación exterior izquierda) a "Inner Join" (Combinación interior).
    .
  2. Para cambiar la propiedad Join Model (Modelo de combinación) haga clic en el ajuste por defecto Left Outer Join (Combinación exterior izquierda) y luego haga clic en [...] que aparece al lado de Left Outer Join. En la ventana Options (Opciones) haga clic en Inner Join (Combinación interior) y luego en OK.

    Aviso: Al cambiar los ajustes por defecto, aparecerá un puntito rojo con el número 1 en el icono de los ajustes de tMap. Esto indica que ha modificado un parámetro de los ajustes por defecto de tMap.
    .
  3. Cierre el asistente de tMap y ejecuta la Tarea.

En el Diseñador de tareas, observe que el componente tMap procesa un total de 1682 filas de datos de la entrada de la izquierda. Sin embargo en el archivo de salida tan solo aparecen 142 filas. Esto es debido a que la combinación interior tan solo ha producido correspondencias para 142 filas, lo que significa que las demás filas han sido descartadas.

Puede validar el descarte de otras filas viendo el archivo de salida de moviesComplete. En el archivo observe que todas las películas llevan el nombre de los directores.

2. Cree un nuevo archivo de salida en el componente tMap para compilar tan solo los descartes de la combinación interior.

  1. Abra el asistente del componente tMap_1 y cree un segundo componente de salida con el nombre joinRejects. Se creará un flujo de salida vacío.
  2. Para añadir los campos movieID, title, releaseYear, url y directorID al componente de salida, seleccione los cinco campos del componente "movies" y arrástrelos hasta el componente de salida.
  3. En el archivo de salida joinRejects haga clic en tMap settings (Ajustes de tMap).
  4. Para cambiar la propiedad "Catch lookup inner join reject" (Detección de descartes de la combinación interior), haga clic en el ajuste por defecto false (falso) y luego en [...] que aparece al lado de "false". En la ventana Options (Opciones) haga clic en true (verdadero) y luego en OK.

    Aviso: Al cambiar la propiedad Detección de descartes de la combinación interior a "true" podrá captar todas las líneas de datos que fueron descartadas por la combinación interior en el nuevo archivo de salida.
    .
  5. Añada un componente tFileOutputDelimited al Diseñador de tareas y vincule el archivo de salida joinRejects del componente tMap_1 a tFileOutputDelimited_2.
  6. Para configurar el componente de salida, en la vista Component (Componente) especifique la ruta y el nombre del archivo de salida. Incluya también una fila de encabezado en el archivo de salida y ejecute la Tarea.

En el Diseñador de tareas observará que, de 1682 filas de los datos de entrada, aparecen 142 en el archivo de salida joinedOutput y las 1540 descartadas se recogen en el archivo de salida joinRejects.

También puede visualizar el archivo de salida joinRejects y ver todas las películas que fueron descartadas por la combinación. Estas son las películas que no tienen directorID en el archivo "movies", además de las que tienen directorID en "movies" que faltan en el archivo "directors".