Cómo mejorar la calidad de los datos [RGPD, Medida 10]

El Reglamento General de Protección de Datos (RGPD), presentado por la Unión Europea, entró en vigor el 25 de mayo de 2018. Con la aprobación del RGPD, las organizaciones deben asegurar que los datos personales de interesados como clientes actuales y futuros y empleados sean completos y veraces.

Hace poco en Talend celebramos un webinar a petición, Medidas prácticas para cumplir el RGPD, centrado en un exhaustivo plan de 16 medidas para hacer efectivo un programa de gobernanza de datos compatible con la conformidad con el RGPD.

La medida 10 de este plan consiste en mejorar la calidad de los datos. Para consultar cuáles son las nueve primeras medidas, eche un vistazo a los enlaces de la barra lateral.

Watch Practical Steps to GDPR Compliance now.
Watch Now

La perspectiva del RGPD sobre la calidad de los datos

El artículo 16 del RGPD exige a las empresas que rectifiquen los datos personales inexactos y que completen los datos personales incompletos sin dilación indebida. Los equipos de gobernanza tienen que establecer controles para permitir a los interesados abordar cualquier cuestión de calidad que afecte su información personal de forma oportuna.

También es importante la conciliación de datos, porque puede suceder que los datos de clientes y empleados estén fragmentados en múltiples ubicaciones y sistemas dentro de la organización. Según el RGPD, esta información debe conciliarse y disponer de una visión completa y coherente de la misma que los interesados puedan consultar si así lo solicitan.

Usar Talend para mejorar la calidad de los datos

A las empresas estadounidenses los datos erróneos les cuestan 3 billones de dólares al año. Esos errores son la razón por la que no comprenden a sus clientes e incumplen el RGPD, lo que puede acarrear multas considerables. Sin duda, se trata de una cuestión importante que la mayoría de organizaciones debe abordar.

A continuación presentamos varios factores que generan errores en los datos, así como las herramientas de Talend correspondientes que contribuyen a resolverlos:

  1. Compartimentos de información: en el mundo de los big data, la información procede de fuentes y sistemas muy diversos. Talend Data Integration Platform coteja datos de distintas fuentes en una plataforma común.
  2. Tecnologías diversas: debido a la amplia gama de tecnologías que emplean las empresas, los datos llegan en formatos diferentes. Talend Data Integration Platform ayuda a integrar fácilmente distintas herramientas y aplicaciones con cualquier tecnología (por ejemplo, a escribir un MapReduce o una tarea de Spark) y a presentar los datos en un formato uniforme.
  3. Datos incongruentes: como los datos llegan de fuentes diversas, es posible que se observen discrepancias. Por ejemplo, los sistemas de marketing y ventas podrían disponer de registros distintos del teléfono móvil de un mismo cliente. Talend Data Quality y Talend Data Stewardship ayudan a conciliarlos en un registro maestro (única versión de la verdad).

Integración con el ciclo de vida de la calidad de los datos

Talend Data Quality contribuye a solventar incidencias en cualquier etapa del ciclo de vida de la calidad de los datos (figura 1). El producto ofrece soluciones para todos los contextos: desde descubrir incidencias y normalizar los datos mediante el uso de bibliotecas, a solucionar duplicados y fusionar los registros en una única versión de la verdad y, finalmente, realizar el seguimiento continuo de la calidad de los datos.

mejorar calidad de datos

Figura 1: Ciclo de vida de calidad de datos


Genera código nativo para ejecutar controles de calidad y anonimización de datos en el lugar adecuado (localmente en un clúster de Hadoop o en cloud) y en el momento adecuado (en datos en reposo o en streaming). También presenta sofisticadas capacidades de eliminación de duplicados y correspondencia para conciliar o conectar conjuntos de datos entre sistemas (ver figura 2).

calidad de datos

Figura 2: Talend Data Quality puede emparejar automáticamente datos personales con nuevas fuentes de datos a partir de patrones, diccionario u ontologías, y luego etiquetar o aplicar normas en los datos resaltados.

Las organizaciones también deben delegar la autoridad de los delegados de protección de datos a administradores de datos o usuarios corporativos. Por ejemplo, quizá un ingeniero comercial sea el mejor posicionado para garantizar que los datos de contacto de sus cuentas estén siempre actualizados. Un responsable de campaña debe asegurarse de que se disponga de un mecanismo de consentimiento en la base de datos de marketing.

Para permitir a cualquier persona de la organización gestionar el uso de sus datos conforme a la normativa, las organizaciones deberán poner aplicaciones en autoservicio basadas en flujos de trabajo, como Talend Data Preparation o Talend Data Stewardship al alcance de distintos departamentos, brindándoles una mayor autonomía sin por ello poner en riesgo los datos (ver figura 3).

calidad de datos

Figura 3: Talend Data Stewardship permite la orquestación de los flujos de trabajo de administración y la delegación de actividades a, prácticamente, cualquier persona de la organización.

Próximos pasos para mejorar la calidad de datos

Abordar la calidad de los datos resulta fundamental para que las organizaciones den cumplimiento al RGPD. Dada la complejidad del ecosistema de software, este objetivo puede alcanzarse de forma rápida y uniforme con ayuda de soluciones automatizadas y herramientas en autoservicio que recaban, concilian y consolidan los datos.

La próxima medida del exhaustivo plan de 16 medidas de Talend a efectos del RGPD consiste en coser el linaje de datos.

Para obtener más información y consultar las 16 medidas en su totalidad, no se pierda el webinar a petición: Medidas prácticas para cumplir el RGPD. El vídeo aborda información sobre la creación de normas y controles, la identificación de titulares de datos y elementos de datos críticos, la realización de evaluaciones de riesgo, la mejora de la calidad de datos y mucho más.

| Last Updated: agosto 12th, 2019