Confidence threshold: definición
El confidence threshold, es decir, el umbral de confianza de detección, es un parámetro utilizado en los modelos de visión por computador que define el nivel mínimo de confianza que debe alcanzar el modelo para considerar un objeto detectado como una detección válida. En la práctica de la anonimización de fotos y vídeos, se aplica principalmente a la detección de rostros y matrículas antes de su desenfoque o difuminado automático.
Por lo general, un modelo de detección devuelve para cada objeto dos tipos de información: la ubicación del objeto en la imagen, normalmente en forma de cuadro delimitador, y el valor de confidence score, es decir, una puntuación numérica de confianza que indica si una determinada región contiene realmente un rostro o una matrícula. El confidence threshold marca el límite de decisión. Si el resultado del modelo es igual o superior al umbral, el objeto se acepta para su procesamiento posterior. Si el resultado es inferior, la detección se descarta.
En los sistemas de anonimización, este parámetro influye directamente en el riesgo de dos tipos de errores: false positive, cuando se difumina un objeto que no es un rostro ni una matrícula, y false negative, cuando un rostro o una matrícula reales no se detectan y, por tanto, no se anonimizan. Desde la perspectiva de la protección de la privacidad, los false negative suelen ser el error más crítico, ya que implican la divulgación de datos personales en material visual.
El papel del umbral de confianza de detección en la anonimización de fotos y vídeos
En el contexto de la anonimización de material visual, el umbral de confianza no es un ajuste meramente técnico. Es un parámetro relevante tanto para la conformidad del proceso con los requisitos de protección de datos como para la calidad operativa del tratamiento. Cuanto más bajo sea el umbral, más objetos se marcarán como rostros o matrículas. Normalmente, esto aumenta la sensibilidad de detección, pero también incrementa el número de falsas detecciones.
Cuanto más alto sea el umbral, más restrictivo será el sistema y solo aceptará detecciones con alta confianza. Esto reduce el difuminado excesivo, pero puede provocar que se omitan objetos difíciles de detectar, por ejemplo, rostros pequeños, rostros parcialmente ocultos, matrículas con poca iluminación o matrículas vistas en ángulo.
En la práctica, el umbral se configura según el objetivo del proceso:
- para una anonimización centrada en minimizar el riesgo de divulgación de datos, normalmente se elige un umbral más bajo y un control de calidad adicional,
- para materiales con alta calidad de imagen, puede utilizarse un umbral más alto si la validación confirma que se mantiene un nivel adecuado de recall,
- para distintas clases de objetos, por ejemplo, rostros y matrículas, pueden utilizarse umbrales diferentes.
Cómo funciona técnicamente el confidence threshold
Los sistemas modernos de detección de rostros y matrículas suelen basarse en modelos de deep learning, principalmente redes neuronales convolucionales u otras arquitecturas actuales de detección. El deep learning es aquí el enfoque habitual durante la construcción del modelo de IA, ya que es en los conjuntos de entrenamiento donde el modelo aprende las características visuales que le permiten reconocer rostros y matrículas en condiciones diversas. El modelo ya entrenado se utiliza después en el proceso de difuminado automático.
El confidence score no siempre es una probabilidad calibrada en sentido estadístico. En muchas arquitecturas es un valor tras una función sigmoid o softmax, pero su interpretación depende del modo en que se haya entrenado y validado el modelo. Por este motivo, el umbral no debe fijarse únicamente de forma intuitiva. Debe definirse a partir de pruebas realizadas sobre un conjunto representativo de los datos reales de entrada.
La regla de decisión típica es:
detección aceptada cuando score >= threshold
Tras esta etapa, a menudo se aplican procedimientos adicionales, por ejemplo Non-Maximum Suppression, que eliminan cuadros superpuestos correspondientes al mismo objeto. Esto afecta al número final de detecciones y conviene tener en cuenta que el resultado final no depende solo del threshold, sino también de los demás parámetros del flujo de detección.
Parámetros y métricas clave relacionados con el confidence threshold
Evaluar si el umbral está bien configurado requiere medir la calidad. En las tareas de detección de objetos se utilizan métricas ampliamente descritas en la literatura y en benchmarks como PASCAL VOC y COCO. En anonimización, las más importantes son las métricas que muestran con qué frecuencia el sistema omite objetos que deberían ocultarse.
Métrica | Significado práctico | Efecto de cambiar el threshold
|
|---|---|---|
Precision | Qué proporción de las detecciones aceptadas es correcta | Un threshold más alto suele aumentar la precision |
Recall | Qué proporción de los objetos reales ha sido detectada | Un threshold más bajo suele aumentar el recall |
F1-score | Media armónica de precision y recall | Ayuda a encontrar un equilibrio |
False Discovery Rate | Nivel de etiquetas erróneas entre las detecciones aceptadas | Aumenta cuando el threshold es demasiado bajo |
False Negative Rate | Nivel de omisiones de rostros o matrículas | Aumenta cuando el threshold es demasiado alto |
mAP con IoU 0.5 o 0.5:0.95 | Calidad global del detector en benchmarks | Sirve para evaluar el modelo, pero no sustituye la selección del threshold |
En las tareas de protección de la privacidad, el recall tiene una importancia especial. Si el recall para rostros o matrículas es demasiado bajo, parte de los datos personales seguirá siendo visible. Por eso, el threshold óptimo no siempre es el que maximiza la precision o el mAP.
Práctica de selección del umbral en sistemas de anonimización
La selección del umbral debe basarse en una validación realizada con datos similares al material que realmente se va a procesar. Son importantes factores como la resolución, el ángulo de la cámara, la compresión, la hora del día, las condiciones meteorológicas y el grado de ocultación de los objetos. Un umbral ajustado con un conjunto de laboratorio puede no funcionar correctamente en grabaciones de videovigilancia, cámaras móviles o fotos tomadas con un smartphone.
En la práctica, se recomienda:
- probar por separado la detección de rostros y de matrículas,
- trazar curvas de precision-recall para varios niveles de threshold,
- seleccionar el umbral en función de un nivel aceptable de false negative,
- revalidar periódicamente tras cambios en el modelo, la cámara, el códec o el escenario de uso,
- aplicar revisión manual en los casos límite.
En el software Gallio PRO, la detección automática se aplica a rostros y matrículas. El sistema no detecta automáticamente logotipos, tatuajes, placas identificativas, documentos ni contenido mostrado en pantallas de monitores. Estos elementos pueden difuminarse manualmente en el editor integrado. Esto significa que incluso un confidence threshold correctamente configurado no elimina la necesidad de revisar el material en busca de otros identificadores visuales.
Limitaciones y contexto de cumplimiento normativo
El umbral de confianza no garantiza una anonimización completa. Es solo uno de los parámetros del sistema de detección. El resultado también depende de la calidad del modelo, los datos de entrenamiento, la forma de anotación, el tamaño mínimo del objeto, el preprocesamiento y los parámetros de seguimiento entre fotogramas en el material de vídeo.
Desde la perspectiva del cumplimiento del RGPD, es esencial un enfoque basado en el riesgo y la selección de medidas técnicas adecuadas a la finalidad del tratamiento. El Reglamento (UE) 2016/679 no establece un valor concreto de confidence threshold, pero exige la aplicación de medidas técnicas y organizativas apropiadas de conformidad con los artículos 24, 25 y 32. En la práctica, esto implica la necesidad de documentar las pruebas de eficacia de la anonimización y de justificar los parámetros adoptados.
En materiales que contienen matrículas, también debe tenerse en cuenta el contexto jurídico y fáctico. Un número de matrícula no siempre constituye un dato personal, pero puede llegar a serlo si, mediante medios razonablemente probables, permite identificar a una persona física. En la práctica de la protección de la privacidad, su difuminado se aplica con frecuencia como medida de precaución, especialmente cuando el material va a difundirse de forma más amplia.
Referencias normativas y fuentes
El concepto de confidence threshold no tiene una única definición normativa en una norma jurídica, pero su significado técnico es coherente con la práctica del aprendizaje automático y la detección de objetos. En implementaciones reales, conviene basarse en fuentes primarias, documentación de modelos y benchmarks reconocidos.
- Reglamento (UE) 2016/679, RGPD - artículos 24, 25 y 32.
- NIST IR 8280, Factsheets for AI and Automated Decision Systems, 2021 - importancia de documentar parámetros y limitaciones de los sistemas de IA.
- PASCAL VOC Challenge - Everingham et al., International Journal of Computer Vision, 2010 - métricas de precision, recall y AP para detección de objetos.
- COCO Detection Evaluation, Microsoft COCO - definiciones utilizadas de AP e IoU en la evaluación de detectores.
- Guo et al., On Calibration of Modern Neural Networks, ICML 2017 - limitaciones de interpretar el score como una probabilidad calibrada.