Anonimización
Introducción
La anonimización automática de datos, basada en tecnologías de procesamiento del lenguaje natural, es el proceso de eliminación o sustitución de información sensible de fuentes textuales para proteger a las personas de exponer sus datos personales. Además, permite analizar los datos cumpliendo con el GDPR (General Data Protection Regulation). En la actualidad, esta tecnología ha mejorado sus usos y resultados potenciales gracias al avance de las tecnologías de Deep Learning.
Funciones
Detección de Idiomas
Detección automática del idioma del texto
Detección de Datos
Detección automática de fragmentos de texto que contienen información sensible
Clasificación de Datos
Clasificación automática de las entidades detectadas en categorías como PERSONA, LUGAR, etc.
Anonymization
Ocultación de datos sensibles mediante la sustitución por marcadores de posición que pueden contener símbolos (“XXX”), la categoría de datos sensibles o palabras similares a las originales
Mercados
Sanidad
Para llevar a cabo el desarrollo de soluciones tecnológicas y la investigación en el campo de la medicina, es imprescindible poder compartir información que contenga datos personales especialmente sensibles
Justicia
Analiza, detecta y sustituye los datos sensibles en los documentos jurídicos, como las sentencias judiciales, contribuyendo a los datos abiertos y a la transparencia
Administración Pública
Promueve el intercambio de datos de-identificación sin detalles personales rastreables, cumpliendo con el General Data Protection Regulation (GDPR)
Caso de uso
MAPA
Un proyecto Europeo
Desarrollo de un conjunto de herramientas para la anonimización eficaz y fiable de textos en los ámbitos médico, jurídico y administrativo en 24 idiomas. Promoviendo la viabilidad de compartir datos de-identificación sin detalles personales rastreables, haciéndolos conformes al GDPR.