Presentamos el Inicio rápido de data lake desde Talend, Amazon Web Services y Cognizant

Presentamos el Inicio rápido de data lake desde Talend, Amazon Web Services y Cognizant

  • Edward Ost
    Over 25 years of experience in application and web development with extensive experience on both Java and .NET platforms. Ed works as the Channels Technical Director at Talend working with technology partners, commercial use customers, and SI partners in the Talend ecosystem. Current focus is on enterprise integration strategies spanning DW, Data Lake, and operational decision support systems using the Talend Unified Platform.

Todos los años vemos cómo gana terreno el concepto de data lake en el mundo de las empresas. Las organizaciones que aspiran a sacar provecho del potencial de los datos para la transformación corporativa cada vez más recurren a los data lake cloud para recopilar y analizar datos estructurados, semiestructurados y no estructurados para transformarlos en su información comercial.

Sin embargo, por mucho que el data lake hoy en día es un concepto muy aceptado tanto localmente como en cloud, a las organizaciones les sigue costando darles utilidad y llenarlos de datos limpios y fiables. En realidad, Gartner predijo que en 2018 el 90 % de los data lakes desplegados no servirían de nada. Esto es debido, sobre todo, a unas combinaciones voluminosas y más complejas de fuentes y modelos de datos que hacen su aparición como nunca antes.

Dada esta coyuntura de mercado, hemos llegado a un acuerdo con Cognizant y Amazon Web Services para crear una solución completa de Inicio rápido para desplegar data lakes en AWS. A grandes rasgos, se trata de una arquitectura de datos completa que ayuda a las organizaciones a poner a punto rápidamente sus data lakes en cloud. Está pensada para usuarios que estén evaluando el uso de big data en cloud o deseen acelerar su iniciativa de big data adoptando mejores prácticas para la integración de big data.

Me gustaría dedicar un espacio a repasar algunas de las principales características de esta nueva solución.

Funcionalidades de un inicio rápido de data lake:

El objetivo de este nuevo Inicio rápido es aportar simplicidad a los clientes. Queremos que no haya nadie que no pueda desplegar data lakes en cloud. Con esa idea hemos incluido una serie de funcionalidades que le permitirán empezar a trabajar en AWS en cuestión de minutos y luego evaluar al cabo de días, no semanas.

El Inicio rápido ofrece las siguientes prestaciones:

  • Permite el autoservicio al aprovisionar los servicios y componentes necesarios para la creación de un data lake.
  • Ofrece flexibilidad para preparar entornos para el desarrollo, las pruebas y la producción.
  • Incluye un conjunto de datos de muestra opcional y tareas previamente creadas de Talend Spark que le ayudarán a estudiar la arquitectura y a entender las etapas del flujo de trabajo completo.
  • Ofrece el framework de ingesta para Cognizant, validación de big data y una plataforma DevOps para ingerir, validar y desplegar soluciones de big data.

La arquitectura de integración de datos en el inicio rápido

En esta arquitectura de referencia, todos los flujos de datos están diseñados en Talend Open Studio y orquestados por Talend Big Data Platform. Con Talend Open Studio puede crear plantillas de tarea mediante una interfaz visual fácil de entender. También ofrece capacidades de gestión de metadatos.

Posteriormente Talend Big Data Platform ejecuta dichas tareas para hacer avanzar los datos por el flujo (ver figura 2). Puede utilizar estas tareas previamente creadas de muestra con el Inicio rápido para comprobar los resultados del sistema. El nuevo Inicio rápido también contiene una serie de tareas previamente creadas para mostrarle el flujo y el uso del sistema.

Conclusión

Con esta solución exhaustiva y lista para usar, las organizaciones pueden empezar a producir información decisiva en cuestión de pocas semanas o meses gracias a los potentes servicios analíticos de AWS, como Amazon QuickSight y Amazon Machine Learning (Amazon ML). Las funcionalidades mencionadas son tan solo algunas de las razones para echar un vistazo a nuestra nueva solución de Inicio rápido de data lakes con Cognizant y AWS.

Le animo a obtener una licencia de evaluación, echar un vistazo a nuestra página completa sobre el Inicio rápido y seguir nuestra guía de referencia paso a paso.

Join The Conversation

0 Comments

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *