¿Qué es el aprendizaje automático (Machine Learning, ML)?

Tabla de contenidos

Aprendizaje automático: definición
El papel del ML en la anonimización de imágenes y vídeo
Tecnologías y arquitecturas de ML en la detección de rostros y matrículas
Parámetros y métricas clave en la anonimización basada en ML
Retos y limitaciones
Ejemplos de uso
Referencias normativas y fuentes

Aprendizaje automático: definición

El aprendizaje automático (Machine Learning, ML) es un conjunto de métodos que permiten a los sistemas informáticos aprender patrones a partir de datos y tomar decisiones sin necesidad de programar reglas explícitas. La norma internacional ISO/IEC 22989:2022 define el ML como un enfoque dentro de la inteligencia artificial en el que los modelos mejoran su rendimiento en una tarea específica gracias a la experiencia contenida en los datos (fuente: ISO/IEC 22989:2022). El marco de gestión de riesgos NIST AI RMF 1.0 destaca el ciclo de vida de los sistemas de IA, incluidos los componentes de ML, que abarca la preparación de datos, el entrenamiento, la validación, el despliegue y la monitorización (fuente: NIST AI RMF 1.0, 2023).

En el contexto de la anonimización de imágenes y vídeos, el Machine Learning se utiliza para la detección automática de elementos que deben ocultarse. Los más habituales son los rostros y las matrículas de vehículos. Un modelo entrenado con datos etiquetados detecta estos objetos en los fotogramas y devuelve su ubicación junto con un nivel de confianza. El resultado de la detección se emplea para generar máscaras de desenfoque o pixelado que reducen el riesgo de identificación de personas o vehículos, de conformidad con el RGPD y las directrices de las autoridades de protección de datos (fuentes: EDPB 3/2019, WP29 05/2014, ISO/IEC 20889:2018).

El papel del ML en la anonimización de imágenes y vídeo

Una anonimización eficaz requiere la localización fiable de elementos sensibles. Las reglas basadas en heurísticas simples resultan insuficientes ante iluminación variable, grabaciones con cámaras móviles o situaciones de oclusión parcial. El ML, y en particular el deep learning, ofrece mayor robustez frente a estas variaciones gracias al entrenamiento con grandes conjuntos de datos de referencia. Para automatizar el desenfoque es necesario crear primero un modelo de detección con sensibilidad y precisión adecuadas, y posteriormente integrarlo en el flujo de procesamiento del material.

En una cadena de procesamiento típica, las etapas incluyen la decodificación de vídeo, la detección de objetos, el seguimiento opcional entre fotogramas, la generación de máscaras y la exportación final. Gallio PRO automatiza la detección y el desenfoque exclusivamente de rostros y matrículas. El software no detecta automáticamente logotipos, tatuajes, placas identificativas ni contenido de pantallas; estos elementos pueden difuminarse manualmente en el editor. La herramienta funciona en modo por lotes, no en tiempo real. La implementación on-premise permite procesar los datos dentro de la organización y limitar su transferencia. Gallio PRO no recopila registros de detección que contengan datos personales o sensibles.

Tecnologías y arquitecturas de ML en la detección de rostros y matrículas

La detección de objetos en imágenes se basa principalmente en redes neuronales profundas. La elección de la arquitectura depende del equilibrio entre calidad y velocidad, así como de los recursos computacionales disponibles (CPU, GPU). Los modelos se entrenan de forma supervisada con conjuntos de datos anotados mediante bounding boxes o máscaras.

Redes convolucionales de detección: como Faster R-CNN, RetinaNet, YOLOv3 y las versiones más recientes de la familia YOLO (por ejemplo, YOLOv5–YOLOv8). Son eficientes para la detección de rostros y matrículas y se emplean ampliamente en tareas de baja latencia (fuentes: Ren 2015, Lin 2017, Redmon 2018).
Transformers de visión: como DETR y sus variantes, que simplifican la asignación de predicciones a costa de mayores requisitos computacionales; adecuados para escenas complejas (fuente: Carion 2020).
Segmentación: cuando se requieren máscaras de formas irregulares se utilizan redes de segmentación; para el desenfoque de rostros y matrículas suelen bastar bounding boxes rectangulares.
Seguimiento de objetos: estabiliza las máscaras entre fotogramas y reduce el parpadeo; se aplica como postprocesamiento.
Preparación de datos: conjuntos como WIDER FACE y bases de datos de matrículas proporcionan benchmarks y métricas de detección como IoU (fuente: Yang 2016; prácticas de evaluación).

Parámetros y métricas clave en la anonimización basada en ML

La evaluación de la calidad de los modelos influye directamente en el riesgo de revelación de identidad y en los costes operativos. A continuación, se presentan métricas fundamentales empleadas en detección de objetos e inferencia.

Métrica	Definición	Unidad/rango	Fuente
Precisión (Precision)	TP/(TP+FP)	0–1	Powers 2011
Exhaustividad (Recall)	TP/(TP+FN)	0–1	Powers 2011
mAP	Media del Average Precision por clases (y, según el benchmark, por umbrales IoU)	0–1	COCO, Lin 2014
IoU	Relación entre el área de intersección y el área de unión entre la detección y la referencia real	0–1	COCO, Lin 2014
Tasa de falsos positivos (FPR)	FP/(FP+TN)	0–1	Powers 2011
Latencia de inferencia	Tiempo de procesamiento de un fotograma	ms	MLPerf Inference v3.0
Rendimiento (Throughput)	Número de fotogramas por segundo	fps	MLPerf Inference v3.0

En la práctica, para la anonimización suele ser más importante un alto recall que una alta precisión, ya que una detección omitida implica mayor riesgo que un desenfoque excesivo. La selección del umbral de confianza debe documentarse y justificarse en el análisis de riesgos conforme a ISO/IEC 23894:2023 y NIST AI RMF 1.0.

Retos y limitaciones

Los modelos pueden reducir su recall en casos de oclusión, ángulos inusuales o baja resolución. Equilibrar recall y precisión exige ajustar adecuadamente el umbral y, en su caso, aplicar seguimiento de objetos. Los datos de entrenamiento con sesgo geográfico o técnico pueden limitar la generalización; por ello son necesarias revisiones de datos y validación cruzada. La ausencia de procesamiento en tiempo real implica planificar el trabajo por lotes y controlar la carga de GPU e I/O.

Los aspectos legales dependen del contexto. En la práctica, la obligación de difuminar matrículas depende de la finalidad y la base jurídica del tratamiento, así como de si, en las circunstancias concretas, la matrícula permite identificar a una persona; no existe una obligación general uniforme en el Derecho de la UE para todos los casos. En España y otros Estados miembros, la consideración de las matrículas como datos personales puede variar según el contexto, y las directrices de las autoridades de protección de datos y la jurisprudencia del TJUE respaldan un enfoque prudente cuando exista riesgo de identificación. La obligación de anonimizar rostros no se deriva automáticamente del RGPD en todos los supuestos: depende de la base jurídica y del cumplimiento de los principios de tratamiento; además, la publicación de la imagen puede estar sujeta a la normativa civil y de propiedad intelectual. En derecho de autor, por regla general se requiere consentimiento para la difusión de la imagen, con excepciones habituales: personas con proyección pública en el ejercicio de sus funciones, personas que aparezcan como elemento accesorio de un conjunto (por ejemplo, una multitud o un evento público) o cuando exista remuneración acordada por posar. Desde la perspectiva de la privacidad, la minimización de registros de detección y las implementaciones on-premise respaldan el principio de privacy by design.

Ejemplos de uso

El Machine Learning respalda la anonimización en grabaciones de videovigilancia, dashcams y cámaras móviles en el marco de solicitudes de acceso a datos conforme al RGPD, en la aportación de pruebas en procedimientos, en la publicación de material de eventos públicos y en la archivación de contenidos formativos. En todos los casos son esenciales métricas auditables, control del umbral de detección y posibilidad de edición manual. En entornos con altos requisitos de seguridad, el procesamiento on-premise reduce la superficie de riesgo.

Referencias normativas y fuentes

ISO/IEC 22989:2022 - Artificial Intelligence - Concepts and terminology.
ISO/IEC 23894:2023 - Artificial Intelligence - Risk management.
ISO/IEC 20889:2018 - Privacy enhancing data de-identification - Terminology and classification of techniques.
NIST AI Risk Management Framework 1.0, 2023.
Reglamento (UE) 2016/679 (RGPD) - art. 4 y considerandos relativos a datos personales.
European Data Protection Board, Guidelines 3/2019 on processing of personal data through video devices, versión 2.0, 2020.
Article 29 Working Party, Opinion 05/2014 on Anonymisation Techniques, 2014.
Lin et al., Microsoft COCO: Common Objects in Context, ECCV 2014.
Yang et al., WIDER FACE: A Face Detection Benchmark, CVPR 2016.
MLCommons, MLPerf Inference v3.0 Results and Rules, 2023.
Ren et al., Faster R-CNN, NIPS 2015; Redmon et al., YOLOv3, 2018; Carion et al., DETR, ECCV 2020.

Ver también

Volver al glosario