¿Qué es el Deep Learning?

Deep Learning - definición

Deep Learning (aprendizaje profundo) es un subconjunto del machine learning que utiliza redes neuronales artificiales multicapa para aprender representaciones de datos y resolver tareas perceptivas complejas, como la detección de objetos, la segmentación y la clasificación de imágenes. Esta definición está recogida, entre otros, en la norma ISO/IEC 22989:2022, que sistematiza los conceptos de inteligencia artificial (fuente: ISO/IEC 22989:2022).

En el contexto de la anonimización de imágenes y vídeo, el deep learning constituye la base para entrenar modelos de detección de rostros y matrículas, que permiten posteriormente el difuminado automático de estas áreas, garantizando coherencia visual y cumplimiento de la normativa de protección de datos.

El papel del deep learning en la anonimización de imágenes y vídeo

Para difuminar rostros y matrículas de vehículos, se necesitan modelos de detección fiables que funcionen tanto en imágenes estáticas como en secuencias de vídeo. El deep learning proporciona estos modelos mediante arquitecturas convolucionales e híbridas capaces de detectar objetos en distintas condiciones de iluminación, perspectivas y escalas.

En Gallio PRO, los modelos de deep learning se utilizan para la identificación automática de áreas correspondientes a rostros y matrículas, tras lo cual se aplica un filtro de desenfoque o pixelado. El software no detecta automáticamente logotipos, tatuajes, placas identificativas ni contenidos en pantallas; estos elementos pueden difuminarse manualmente en el editor. Gallio PRO no admite la anonimización en tiempo real ni el procesamiento de flujos de vídeo en directo. El alcance de la automatización se limita exclusivamente a rostros y matrículas.

Tecnologías de deep learning aplicadas al difuminado de rostros y matrículas

La detección de áreas a anonimizar se basa en clases de modelos consolidadas y en procedimientos de evaluación estandarizados. A continuación, se presentan los enfoques más utilizados junto con sus fuentes científicas y estándares de evaluación.

  • Detección de rostros: detectores convolucionales de una sola etapa, como RetinaFace y SCRFD, combinan la extracción de características con la detección de puntos clave, lo que facilita un enmascaramiento estable incluso con inclinaciones de cabeza (fuentes: Deng et al., CVPR 2020 - RetinaFace; Guo et al., 2021 - SCRFD; conjunto WIDER FACE - Yang et al., 2016).
  • Detección de matrículas: se emplean detectores de objetos de propósito general adaptados a la clase “license plate”, así como soluciones especializadas dentro de cadenas ALPR (Automatic License Plate Recognition). Para investigación y validación se utilizan conjuntos públicos como UFPR-ALPR y AOLP (fuentes: Gonçalves et al., 2018 - UFPR-ALPR; Hsieh et al., 2011 - AOLP).
  • Seguimiento en vídeo: tras la detección en fotogramas consecutivos, se aplican algoritmos de asociación como DeepSORT o ByteTrack para garantizar la continuidad del enmascaramiento del mismo objeto a lo largo de la escena y reducir el parpadeo de las máscaras (fuentes: Wojke et al., 2017 - DeepSORT; Zhang et al., 2022 - ByteTrack).
  • Pre y postprocesamiento: normalización de la entrada, escalado adecuado de imágenes, NMS o Soft-NMS para reducir detecciones duplicadas y, posteriormente, aplicación determinista de filtros de desenfoque o mosaico en las áreas definidas. La evaluación se realiza conforme a las metodologías VOC/COCO, utilizando métricas como IoU y mAP (fuentes: Everingham et al., IJCV 2015 - PASCAL VOC; Lin et al., ECCV 2014 - COCO).

Parámetros y métricas clave (deep learning para la anonimización)

En la práctica, el Delegado de Protección de Datos y el equipo técnico necesitan criterios medibles. Las siguientes métricas y atributos permiten evaluar si un sistema de anonimización basado en deep learning alcanza el nivel esperado de calidad y seguridad en el tratamiento.

Métrica/Atributo

Definición

Cómo medir

Importancia para la anonimización

 

Precision y Recall

Precision: proporción de detecciones que son verdaderos positivos. Recall: proporción de objetos correctamente detectados.

En datos de validación anotados. Según la práctica VOC/COCO, un objeto se considera detectado cuando la IoU supera un umbral determinado (VOC históricamente IoU=0,5; COCO utiliza AP media para umbrales de 0,5 a 0,95 en pasos de 0,05).

En la anonimización es prioritario un alto Recall para minimizar el riesgo de dejar un rostro o matrícula sin difuminar.

mAP

Precisión media (Average Precision) promediada por clases; en COCO también promediada por distintos umbrales IoU.

mAP@0,5 (VOC) o mAP@[0,5:0,95] (COCO), conforme a protocolos estandarizados.

Evaluación integral del detector de rostros y matrículas en distintos niveles de solapamiento.

IoU

Intersection over Union: medida del solapamiento entre predicción y anotación. IoU = área_intersección / área_unión.

Calculada para cada objeto. El umbral depende del caso de uso y de la política de aceptación de errores.

Un IoU más alto implica máscaras más precisas y menor riesgo de revelar partes de la imagen.

Latencia y FPS

Tiempo de procesamiento por fotograma y rendimiento en fotogramas por segundo.

Mediciones end-to-end en la infraestructura on-premise con resoluciones representativas.

Influye en los plazos de ejecución y en la planificación de recursos computacionales, aunque Gallio PRO no funciona en tiempo real.

Estabilidad del seguimiento

Calidad en la preservación de la identidad de los objetos entre fotogramas en seguimiento multiobjeto.

Métricas como IDF1 o HOTA para seguimiento multiobjeto.

Reduce el parpadeo y las interrupciones del enmascaramiento en secuencias largas.

Deriva de datos (data drift)

Cambios en la distribución de los datos de entrada respecto al entrenamiento.

Monitorización estadística y validaciones periódicas; según ISO/IEC 23053:2022, el ciclo de vida del ML debe incluir supervisión continua.

Previene descensos de Recall con nuevas cámaras, escenas nocturnas u otros dominios.

Retos y limitaciones

La eficacia del deep learning en la anonimización de imágenes y vídeo depende de la calidad de los datos, la selección de modelos y la gestión de riesgos. A continuación, se presentan los aspectos clave a considerar en el diseño y auditoría de la solución.

  • Condiciones difíciles: movimientos bruscos de cámara, desenfoque por movimiento, ángulos extremos y oclusiones parciales dificultan la detección. La elección de arquitectura y las técnicas de aumento de datos son críticas (WIDER FACE documenta estos desafíos).
  • Deriva de dominio: nuevos tipos de cámaras, compresión, iluminación IR o distintos formatos de matrícula pueden reducir el Recall. Se requiere validación periódica y posible reentrenamiento (ISO/IEC 23053:2022).
  • Riesgo para la privacidad: los falsos negativos pueden implicar incumplimientos del RGPD. En la práctica se aplican enfoques defensivos, como umbrales de confianza más bajos para la clase “face” y revisión humana de casos límite (privacy by design - art. 25 RGPD).
  • Aspectos legales: el CEPD (EDPB) en sus Directrices 3/2019 indica que la imagen de una persona -y también datos que permitan la identificación indirecta en un contexto determinado, como una matrícula- pueden constituir datos personales, lo que justifica su anonimización antes de compartir grabaciones. En algunas jurisdicciones existen interpretaciones divergentes respecto a las matrículas; por ello, la política organizativa debe adoptar un enfoque prudente basado en el principio de minimización de datos (art. 5.1.c RGPD).
  • Límites funcionales: Gallio PRO difumina automáticamente solo rostros y matrículas. Otros elementos pueden enmascararse manualmente en el editor. El software funciona on-premise y no almacena registros que contengan detecciones, datos personales ni datos sensibles.

Casos de uso y práctica operativa en Gallio PRO

El proceso típico incluye la preparación del material, la inferencia de modelos y la validación. La versión on-premise permite mantener el control total sobre los datos y cumplir los requisitos de seguridad del tratamiento establecidos en el art. 32 del RGPD, así como las buenas prácticas de gestión de riesgos en sistemas de IA.

  • Preparación: importación de materiales, selección del perfil de anonimización, configuración del tipo de filtro (desenfoque, mosaico) y posibles excepciones operativas.
  • Inferencia: detección de rostros y matrículas, asociación entre fotogramas, generación de máscaras estables y aplicación del efecto visual. Sin procesamiento en directo. Posibilidad de trabajo por lotes con recursos GPU/CPU locales.
  • Control de calidad: revisión de muestras y, si es necesario, corrección manual en el editor. En proyectos de mayor riesgo se recomienda muestreo estadístico y reporte de métricas Recall/Precision en un conjunto de control.
  • Gestión del ciclo de vida: monitorización de la deriva de datos, actualización de modelos conforme a ISO/IEC 23053:2022 y gestión de riesgos según ISO/IEC 23894:2023 y NIST AI RMF 1.0 (2023).

Referencias normativas y fuentes

  • ISO/IEC 22989:2022 - Information technology - Artificial intelligence - Artificial intelligence concepts and terminology.
  • ISO/IEC 23053:2022 - Framework for Artificial Intelligence (AI) systems using machine learning.
  • ISO/IEC 23894:2023 - Artificial intelligence - Risk management.
  • ISO/IEC 20889:2018 - Privacy enhancing data de-identification terminology and classification of techniques.
  • Reglamento (UE) 2016/679 (RGPD) - en particular art. 4.1, art. 5.1.c, art. 25 y art. 32.
  • EDPB, Guidelines 3/2019 on processing of personal data through video devices, versión adoptada el 29.01.2020.
  • NIST AI Risk Management Framework 1.0, 2023.
  • Everingham et al., The PASCAL Visual Object Classes Challenge: A Retrospective, IJCV 2015.
  • Lin et al., Microsoft COCO: Common Objects in Context, ECCV 2014.
  • Yang et al., WIDER FACE: A Face Detection Benchmark, CVPR 2016.
  • Deng et al., RetinaFace: Single-stage Dense Face Localisation in the Wild, CVPR 2020.
  • Guo et al., SCRFD: Towards Efficient Face Detection via Structure Rectified Feature Pyramid, 2021.
  • Wojke et al., DeepSORT, 2017.
  • Zhang et al., ByteTrack, ECCV 2022.
  • Gonçalves et al., UFPR-ALPR, 2018.
  • Hsieh et al., AOLP, 2011.