¿En qué consiste la integridad de los datos y por qué es importante?

Imagine lo siguiente: Una empresa farmacéutica pregona información sobre la seguridad de su nuevo fármaco milagroso. Ahora bien, cuando la FDA inspecciona su centro de producción extraterritorial, se detiene el trabajo de inmediato; faltan datos de control de calidad de gran importancia. Por desgracia, son frecuentes ejemplos reales como este de integridad de datos comprometida. Existen problemas de precisión y coherencia de datos en todos los sectores que pueden provocar desde pequeños fastidios a graves problemas para la empresa.

En esta época de los big data, en la que se trata y almacena más información que nunca, cada vez es más importante poner en práctica medidas que conserven la integridad de los datos recabados. El primer paso para conservar la seguridad de los datos es entender los conceptos básicos de la integridad y saber cómo funciona. Siga leyendo para conocer qué es la integridad de datos, la razón de su importancia y qué opciones tiene a su disposición para conservar la integridad de sus datos.

¿Qué es la integridad de los datos?

La integridad de datos se refiere a la precisión, integralidad y coherencia general de los datos. La integridad de datos también guarda relación con los datos en su faceta de conformidad normativa, como sucede con el cumplimiento del RGPD y en materia de seguridad. Se mantiene gracias a un conjunto de procesos, reglas y normas que se ponen en práctica durante la fase de diseño. Cuando la integridad de los datos es segura, la información almacenada en una base de datos seguirá siendo completa, precisa y fiable por mucho tiempo que pase almacenada o por muchas veces que acceda uno a ella. La integridad de los datos también garantiza que sus datos estarán a salvo de fuerzas externas.

Download Debunking Data Quality Myths now.
Download Now

Tipos de integridad de datos

Existen dos tipos de integridad de datos: la integridad física y la lógica. Ambas son conjuntos de procesos y métodos que hacen cumplir esa integridad en bases de datos tanto jerárquicas como relacionales.

Integridad física

La integridad física es la protección de la integridad y la precisión de los datos tal y como están almacenados y como son extraídos. Cuando tiene lugar una catástrofe natural, se produce un apagón o unos hackers alteran las funciones de una base de datos, se dice que se ha comprometido la integridad física. El error humano, la erosión del almacenamiento y toda una retahíla de incidencias también pueden imposibilitar que los gestores de tratamiento de datos, programadores de sistemas o aplicaciones y los auditores internos obtengan datos veraces.

Integridad lógica

La integridad lógica conserva los datos sin ningún cambio, puesto que se emplean de forma distinta en una base de datos relacional. La integridad lógica protege a los datos del error humano y también de los hackers, pero de una forma muy distinta a la integridad física. Existen cuatro tipos de integridad lógica.

Integridad de la entidad

La integridad de la entidad se basa en la creación de unas claves primarias, o valores únicos, que identifican datos para asegurar que no aparezcan enumerados más de una vez y que no haya ningún campo de una tabla considerado nulo. Es una prestación de los sistemas relacionales que almacenan datos en tablas que pueden enlazarse y emplearse de formas muy distintas.

Integridad referencial

La integridad referencial es una serie de procesos que aseguran que los datos se almacenen y se utilicen uniformemente. Las reglas integradas en la estructura de la base de datos sobre cómo se utilizan claves foráneas para garantizar que tan solo se produzcan cambios, incorporaciones o supresiones de datos adecuados. Las reglas pueden incluir restricciones que eliminen la entrada de datos duplicados, aseguren que los datos son veraces y/o impidan la entrada de datos no pertinentes.

Integridad de dominio

La integridad de dominio es el conjunto de procesos que garantizan la veracidad de cada dato de un dominio. En este contexto, un dominio es un conjunto de valores aceptables que una columna puede contener. Puede incorporar restricciones y otras medidas que limiten el formato, tipo y cantidad de datos introducidos.

Integridad definida por el usuario

La integridad definida por el usuario comprende las reglas y restricciones creadas por el usuario para adaptarse a sus necesidades particulares. En ocasiones con la integridad de entidad, referencial y de dominio no basta para salvaguardar los datos. A menudo, deben tenerse en cuenta determinadas reglas corporativas concretas e incorporarse en las medidas referentes a la integridad de los datos.

Qué no es la integridad de datos

Cuando se habla tanto de la integridad de los datos, resulta fácil hacerse un lío y confundir el verdadero significado del término. Muchas veces la seguridad y la calidad de los datos son sustituidas erróneamente por la integridad, cuando cada uno de estos términos hace referencia a una realidad específica.

La integridad de datos no es seguridad de datos

La seguridad de datos es el conjunto de medidas adoptadas para evitar la corrupción de los datos. Incorpora el uso de sistemas, procesos y procedimientos que mantienen los datos inaccesibles para los demás, que podrían usarlos de forma perjudicial o distinta a la prevista. Las infracciones en materia de seguridad pueden ser pequeñas y fáciles de contener o grandes y provocar daños considerables.

Si bien la integridad de los datos se ocupa de mantener la información intacta y veraz en el transcurso de su existencia, el objetivo de la seguridad es el de proteger la información de ataques externos. La seguridad de datos tan solo es una de muchas facetas de la integridad de los datos. La seguridad de los datos no es lo suficientemente amplia para que incluya los múltiples procesos necesarios para que los datos no se alteren con el tiempo.

La integridad de datos no es calidad de datos

¿Los datos de su base de datos cumplen los estándares definidos por su empresa y las necesidades de su negocio? La calidad de datos da respuesta a esas preguntas con todo un conjunto de procesos que miden la antigüedad, relevancia, precisión, integralidad y fiabilidad de sus datos.

Al igual que sucede con la seguridad, la calidad de los datos tan solo es una parte de la integridad de los datos, aunque crucial. La integridad de datos engloba todos los aspectos de la calidad de datos y va más allá al implantar un conjunto de reglas y procesos que rigen la forma en la que se introducen los datos, se almacenan, se transfieren, etc.

Download The Definitive Guide to Data Quality now.
Download Now

Integridad de datos y cumplimiento del RGPD

La integridad de los datos es fundamental a la hora de dar cumplimiento a la normativa de protección de datos como el RGPD. El incumplimiento de dichas normativas puede enfrentar las empresas a cuantiosas sanciones. En determinados casos, incluso pueden ser objeto de denuncias que les acarrearían aún más pagos. Si estas infracciones son constantes, las empresas pueden llegar a quebrar.

Por suerte, existen formas de asegurar la integridad de datos que necesita para cumplir el RGPD y otras legislaciones de protección de datos. Eche un vistazo a nuestra serie Medidas prácticas para cumplir el RGPD.

Riesgos en materia de integridad de datos

Son múltiples los factores que pueden afectar a la integridad de los datos almacenados en una base de datos. He aquí algunos ejemplos:

  • Error humano: cuando las personas introducen información de forma incorrecta, cuando duplican o borran datos, no siguen el protocolo adecuado o cometen errores en la puesta en funcionamiento de procedimientos pensados para proteger la información, se pone en jaque la integridad de nuestros datos.
  • Errores de transferencia: cuando no se puede transferir los datos correctamente de una ubicación en una base de datos a otra, se trata de un error de transferencia. Estos errores se producen cuando un dato está presente en la tabla de destino, pero no en la de origen de una base de datos relacional.
  • Virus y errores de programación: el spyware, el malware y los virus son software capaz de invadir un ordenador y alterar, borrar o apropiarse de datos.
  • Hardware comprometido: las averías inesperadas de ordenadores o servidores, así como los problemas de funcionamiento de un ordenador u otro dispositivo, son ejemplos de fallos significativos y pueden ser indicios de que su hardware está afectado. El hardware comprometido puede trasmitir datos de forma incorrecta o incompleta, limitar o eliminar el acceso a los mismos o complicar el uso de la información.

Se pueden minimizar o eliminar fácilmente los riesgos para la integridad de los datos con las siguientes medidas:

  • Limitar el acceso a los datos y cambiar los permisos para restringir los cambios a la información por parte de agentes no autorizados
  • Validar datos para asegurarnos de que son correctos tanto cuando se recaban como cuando se utilizan
  • Crear copias de seguridad de los datos
  • Usar registros para hacer un seguimiento de las incorporaciones, modificaciones o supresiones de datos
  • Efectuar auditorías internas periódicas
  • Usar software de detección de errores

Watch 5 Pillars for GDPR Compliance now.
Watch Now

Empezar a trabajar con integración de datos

Proteger la integridad de los datos de su empresa con el uso de métodos tradicionales puede parecer una tarea abrumadora. Las plataformas cloud de integración de datos seguras suponen una alternativa moderna que brinda una visión en tiempo real de todos sus datos. Gracias a herramientas de integración cloud líderes del sector, puede conectar múltiples aplicaciones de datos en origen y obtener acceso a todos los datos de su empresa desde una única ubicación.

Eche un vistazo a la Guía definitiva sobre la gobernanza de datos y descubra cómo crear un marco para la integridad de datos.

| Last Updated: septiembre 18th, 2019