La importancia de crear una taxonomía de datos [RGPD, Medida 2]

El Reglamento General de Protección de Datos (RGPD), presentado por la Unión Europea, entró en vigor el 25 de mayo de 2018. Con la aprobación del RGPD, las organizaciones se verán muy fiscalizadas en cuanto al uso que dan a los datos de carácter personal de clientes actuales y futuros, y empleados. De incumplirse puede incurrirse en multas considerables, por lo que las organizaciones se ven obligadas a entender los datos que almacenan y tomar medidas para protegerlos.

Hace poco celebramos un webinar a petición, Medidas prácticas para cumplir el RGPD, centrado en un exhaustivo plan de 16 medidas para hacer efectivo un programa de gobernanza de datos compatible con la conformidad con el RGPD.

Eche un vistazo a la primera medida del plan: «Cómo elaborar políticas, normativas y controles» La segunda medida consiste en crear una taxonomía de datos.

Watch Practical Steps to GDPR Compliance now.
Watch Now

¿En qué consiste una taxonomía de datos?

La taxonomía de datos es la clasificación de los datos en categorías y subcategorías. Proporciona una visión unificada de los datos de una organización e introduce unas terminologías y semánticas comunes entre varios sistemas. Establecer una jerarquía dentro de un conjunto de metadatos y segregarlos en categorías ayuda a entender mejor las relaciones entre los puntos de datos.

Para garantizar el cumplimiento del RGPD, el equipo de gobernanza de datos de una organización debe colaborar con la arquitectura de datos corporativa para clasificar los datos.

Por ejemplo, la taxonomía de datos podría incluir la información relativa a los empleados como categoría de nivel 1. Luego esta información de los empleados podría clasificarse en varias categorías de nivel 2, como salario y prestaciones, identidad, contactos, información reservada de salud, redes sociales y rendimiento del empleado.

¿Por qué resulta tan crítica la taxonomía de datos en el marco del RGPD?

El RGPD exige que las organizaciones protejan la confidencialidad de los datos personales, compartan cómo almacenan y utilizan esos datos y asuman la responsabilidad de la privacidad y la protección de esos datos. En este contexto resulta fundamental crear una taxonomía de datos. Veamos algunas de las ventajas que nos reporta disponer de una taxonomía:

  • Comprensión esencial de los datos: debido al RGPD, es posible que muchos elementos de datos previos no cumplan con el reglamento y deban resolverse. La taxonomía ayuda a descubrir estos problemas de calidad de los datos ya que nos da una visión fundamental del contenido y el linaje de los datos.
  • Acceso a los datos: el RGPD otorga a los interesados el derecho de acceder a sus datos en formato electrónico cuando lo necesitan. La categorización de los datos ayuda a recuperarlos más rápidamente, ya que amplía la búsqueda de una palabra clave automáticamente a otros términos parecidos relacionados.
  • Análisis de riesgo: la clasificación de los datos ayuda a determinar si existe un riesgo de incumplimiento. El proceso permite identificar los datos considerados de categoría sumamente confidencial. Estos datos, según el RGPD, deberían anonimizarse. Los demás datos no confidenciales pueden excluirse del análisis de cumplimiento legal, lo que nos ahorra tiempo y esfuerzo.
  • Reducir datos no deseados: el RGPD recomienda minimizar los datos para recabar y almacenar solamente los datos personales que resulten estrictamente necesarios. Una taxonomía ayuda a eliminar los datos ROT (redundantes, obsoletos o triviales) existentes, lo que reduce el riesgo de guardar datos personales que incumplan el reglamento.

Download A 16 Step Data Governance Plan for GDPR Compliance now.
Download Now

Cómo usar herramientas Talend para la generación automática de una taxonomía

En Talend Metadata Manager puede utilizarse un glosario comercial para definir un conjunto de términos y vincularlos a categorías y subcategorías, como muestra la figura 1. Elaborar un glosario comercial puede ser tan sencillo como arrastrar un modelo de datos previo bien documentado, importar los términos y definiciones de otras fuentes (p. ej.: CSV, Microsoft Excel) o redactarlo interactivamente a través de la interfaz de usuario durante el proceso de clasificación de objetos.

Una vez publicado, cualquier persona que disponga de las autorizaciones pertinentes podrá acceder al glosario a través de una interfaz de búsqueda.

taxonomía de datos

Figura 1: Glosario comercial de Talend Metadata Manager

Próximos pasos en la creación de una taxonomía de datos

La creación de una taxonomía es tan solo el principio. Tras esta amplia clasificación, es importante asignar titulares de datos y vincular estas categorías genéricas a puntos de datos concretos de distintos sistemas informáticos. Con ello se simplifica la ejecución de perfiles y tareas de limpieza en esos puntos de datos para que resulten fiables y conformes al RGPD.

Para adentrarse en estos próximos pasos sobre la creación de correspondencias de datos y resolver cuestiones de calidad de los datos, consulte el webinar a petición. Aborda el plan de 16 medidas que ayuda a las organizaciones a cumplir con el RGPD.

| Last Updated: agosto 12th, 2019