Gestión básica de metadatos: Qué, cómo y por qué

Gestión básica de metadatos: Qué, cómo y por qué

  • Nitin Kudikala
    Nitin Kudikala is a Customer Success Architect at Talend. In this role, Mr.Kudikala advises firms on how to create value by becoming Data Driven and ensures that they are empowered to use the Talend software in the most optimal way. He has 15 years of experience in the field of Data Governance, Data Quality, Data Warehousing, Master Data Management and Big Data. Prior to Talend, he worked as a Data Management Specialist at PepsiCo and before that as a Senior Consultant at Informatica Corporation.

La gestión de metadatos ha ido convirtiéndose en una de las prácticas más importantes de una estrategia satisfactoria de iniciativa digital. Con el auge de las arquitecturas distribuidas, como los big data y cloud, que pueden crear sistemas y datos compartimentalizados, hoy en día la gestión de metadatos es vital para gestionar los activos informativos de una organización. Internet contiene mucha bibliografía sobre este concepto y es fácil que los lectores se confundan con la terminología. En esta entrada he querido ofrecer a los usuarios un breve repaso sobre la gestión de metadatos en un lenguaje llano.

¿En qué consiste la gestión de metadatos?

Empecemos por lo más básico. Si bien circulan muchas definiciones de la gestión de metadatos, su principal funcionalidad consiste en facultar a los usuarios corporativos para que busquen e identifiquen la información en los atributos clave de una interfaz de usuario web.

Un ejemplo de atributo clave susceptible de búsqueda podría ser un ID de cliente o un nombre de socio. Con un buen sistema de gestión de metadatos, los usuarios corporativos podrán entender de dónde salen los datos de aquel atributo o cómo fueron calculados. Podrán visualizar en qué sistemas empresariales de la organización se está utilizando el atributo (linaje) y entenderán cómo afecta cualquier cambio (análisis de impacto) al atributo, como la longitud del atributo a otros sistemas.

Los usuarios técnicos también tienen necesidades de gestión de metadatos. Al combinar metadatos corporativos con metadatos técnicos, el usuario técnico también descubrirá qué tarea de ETL o proceso de bases de datos se utiliza para cargar los datos al atributo. Los metadatos operativos, como las tablas de control de la carga de un almacén de datos, también pueden combinarse con este modelo de metadatos integrados. Esta información puede ser de suma utilidad para el usuario final si la tiene a su alcance. El resultado final de la gestión de metadatos puede tener el formato de otra "base de datos" de los metadatos de atributos clave de la empresa. El término que el sector emplea para referirse a este tipo de bases de datos es un catálogo de datos, glosario o inventario de datos.

¿Cómo funciona la gestión de metadatos?

La gestión de metadatos tan solo es una de las iniciativas de un programa exhaustivo de gobernanza de datos, pero es la única que aborda la cuestión de los metadatos. Otras iniciativas, como la gestión de datos maestros (MDM) o la calidad de datos (CD) tratan sobre los "datos" reales almacenados en distintos sistemas. La gestión de metadatos integra almacenes de metadatos a escala empresarial.

Herramientas como Talend Metadata Manager ofrecen una forma automatizada de analizar y cargar distintos tipos de metadatos. La herramienta también permite crear un modelo empresarial basado en los metadatos generados de sistemas distintos, como su almacén de datos, herramientas de integración de datos, herramientas de modelado de datos, etc.

Los usuarios podrán resolver conflictos basados, por ejemplo, en nombres o tipos de atributos. También podrá crear tipologías de metadatos a medida para "coser" metadatos entre dos sistemas. Un modelo de gestión de metadatos completamente creado debe ofrecer una visión de 360º sobre la interconexión de distintos sistemas de su organización. Este modelo puede ser un punto de partida para cualquier nueva iniciativa de gobernanza de datos. A partir de ese momento los modeladores de datos sabrán dónde buscar un atributo concreto y usarlo en su propio modelo de datos. Este modelo también son los cimientos de la "base de datos" que comentamos en el apartado anterior. Como sucede con cualquier otra iniciativa de gobernanza de datos, a medida que los metadatos de los sistemas particulares cambian, el modelo necesita actualizarse conforme a una metodología SDLC, que incorpora versionado, flujos de trabajo y autorizaciones. El acceso al modelo de metadatos también debería gestionarse con la creación de funciones, privilegios y políticas.

¿Por qué necesitamos gestionar metadatos?

Pongámoslo fácil: por una cuestión de confianza. Si no se gestionan los metadatos durante todo el ciclo de vida del sistema, se crearán compartimentos de metadatos incongruentes en la organización que no satisfarán las necesidades de todos los equipos y que aportarán información contradictoria. Los usuarios desconocerían la necesidad de confiar en sus datos puesto que no habría metadatos que indicaran cómo ni cuándo llegaron los datos al sistema, ni qué reglas corporativas se aplicaron.

También es necesario contemplar los costes. Si no se gestionan con eficacia los metadatos, cada proyecto de desarrollo tendría que someterse a la definición de requisitos de datos, lo que aumentaría los costes y reduciría la eficiencia. A los usuarios les llegan muchas herramientas y tecnologías, lo que genera redundancia y unos costes excesivos, y tampoco proporciona todo el valor de la inversión, ya que los datos que buscan no están disponibles. Las definiciones de datos se duplican en múltiples sistemas y ello supone un coste de almacenamiento elevadísimo.

A medida que las empresas maduran y se les añaden cada vez más sistemas, necesitan plantearse cómo tienen que gobernarse los metadatos (no tan solo los datos). La gestión de metadatos reporta evidentes ventajas a la empresa, a los usuarios técnicos y la organización en general. Espero que esta introducción sobre los conceptos más básicos de la gestión de metadatos les haya resultado de utilidad. ¡Hasta la próxima!

Participe en las conversaciones

0 Comments

Dejar una Respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *