Anonimización

Introducción

La anonimización automática de datos, basada en tecnologías de procesamiento del lenguaje natural, es el proceso de eliminación o sustitución de información sensible de fuentes textuales para proteger a las personas de exponer sus datos personales. Además, permite analizar los datos cumpliendo con el GDPR (General Data Protection Regulation). En la actualidad, esta tecnología ha mejorado sus usos y resultados potenciales gracias al avance de las tecnologías de Deep Learning.

Funciones

Detección de Idiomas

Detección automática del idioma del texto

Detección de Datos

Detección automática de fragmentos de texto que contienen información sensible

Clasificación de Datos

Clasificación automática de las entidades detectadas en categorías como PERSONA, LUGAR, etc.

Anonymization

Ocultación de datos sensibles mediante la sustitución por marcadores de posición que pueden contener símbolos (“XXX”), la categoría de datos sensibles o palabras similares a las originales

Mercados

Sanidad

Para llevar a cabo el desarrollo de soluciones tecnológicas y la investigación en el campo de la medicina, es imprescindible poder compartir información que contenga datos personales especialmente sensibles

Justicia

Analiza, detecta y sustituye los datos sensibles en los documentos jurídicos, como las sentencias judiciales, contribuyendo a los datos abiertos y a la transparencia

 

 

Administración Pública

Promueve el intercambio de datos de-identificación sin detalles personales rastreables, cumpliendo con el General Data Protection Regulation (GDPR)

 

 

 

Caso de uso

MAPA

Un proyecto Europeo

Desarrollo de un conjunto de herramientas para la anonimización eficaz y fiable de textos en los ámbitos médico, jurídico y administrativo en 24 idiomas. Promoviendo la viabilidad de compartir datos de-identificación sin detalles personales rastreables, haciéndolos conformes al GDPR.

PROBAR