Ordenar un archivo

En este tutorial, utilice un componente de procesamiento y aprenda a ordenar los datos de un archivo.

Este tutorial utiliza la versión 6 de Talend Open Studio Data Integration.

1. Cree una tarea nueva

  1. Asegúrese de que está seleccionada la perspectiva Integración.
  2. Cree una nueva Tarea y dele el nombre SortCSVFile.

El Job Designer (Diseñador de Tareas) abrirá una Tarea vacía.

2. Añada y configure un componente tFileInputDelimited.

  1. Añada un componente tFileInputDelimited a la Tarea.
  2. Para configurar el componente tFileInputDelimited_1, en la vista Component (Componente) haga clic en [...] al lado del campo FileName (Nombre de archivo), seleccione el archivo del disco local y haga clic en Open (Abrir).
  3. Para describir la estructura del archivo, abra el asistente Schema (Esquema) de tFileInputDelimited_1 y haga clic en [...] al lado del campo Edit schema (Editar esquema).
  4. Haga clic en el icono [+] para añadir la primera columna e introduzca la información de aquella columna.
  5. Repita el paso d para cada columna del archivo CSV y cierre el asistente Schema (Esquema).

3. Ordene los datos en su Tarea

  1. Añada un componente tSortRow a la Tarea y vincule los dos componentes.

    Aviso: El esquema del componente tFileInputDelimited_1 es heredado del componente vinculado tSortRow, de modo que no necesita configurarlo.
    .
  2. Para ver el esquema que ha heredado, en la vista Component (Componente) del componente tSortRow haga clic en [...] al lado de Editar esquema.
  3. Para crear una nueva norma de clasificación basada en el año de estreno de la película, haga clic en [+] en la columna Schema (Esquema), haga clic en releaseYear (año de estreno) e indique el orden de clasificación haciendo clic en desc.
  4. Para ver el resultado de la norma de clasificación, en el Diseñador de Tareas añada un componente tLogRow y vincule los componentes tSortRow_1 y tLogRow_1.
  5. Para ejecutar la Tarea, en la vista Run (Ejecutar) de la Tarea sortCSVFile haga clic en Run (Ejecutar).

Ahora las películas del archivo fuente estarán ordenadas por el año en el que se estrenaron.

4. Añada una segunda norma de clasificación

  1. Para añadir una segunda norma de clasificación, en la vista Component (Componente) del componente tSortRow_1 haga clic en (+) y en la columna Schema (Esquema) elija "title" (título). Luego, en la columna de clasificación, elija alpha.
  2. Para ejecutar la Tarea, en la vista Run (Ejecutar) haga clic en Ejecutar.

Ahora las películas estarán ordenadas por año de estreno y, dentro de cada año, por orden alfabético del título de la película.

5. Guarde el resultado de la Tarea en un archivo

  1. Añada un componente tfileOutputExcel al Diseñador de Tareas y vincúlelo a tLogRow_1.
  2. Para configurar el componente de salida, en la vista Component (Componente) especifique la ruta y el nombre del archivo de salida.
  3. Para incluir la fila de encabezado en el archivo de salida, seleccione Include Header (Incluir encabezado).
  4. Para ejecutar la Tarea, en la vista Run (Ejecutar) haga clic en Ejecutar.
  5. Para comprobar el archivo moviesSorted.xls, vaya a la carpeta en la que se creó el archivo y ábralo. Se mostrará el archivo con los datos ordenados.
  6. Para evitar que los datos ordenados se muestren en la vista Run (Ejecutar), haga clic con el botón derecho en tLogRow_1 y haga clic en Deactivate tLogRow (Desactivar tLogRow).
  7. Para ejecutar la Tarea, en la vista Run (Ejecutar) haga clic en Ejecutar.

Se volverá a ejecutar la Tarea. Sin embargo, no se mostrarán los datos en la vista Run (Ejecutar).