¿Qué es la detección de objetos en tiempo real?

Definición

La detección de objetos en tiempo real es la detección y localización de objetos en un flujo de imagen/vídeo bajo un plazo que no excede el intervalo de muestreo/fotograma. Para un flujo con frecuencia F_{video} [Hz], la latencia de extremo a extremo debe satisfacer L_{e2e} ≤ 1/F_{video}. Esto sigue el principio de los sistemas en tiempo real de que la corrección depende de la finalización oportuna dentro de plazos especificados. course.ece.cmu.edu+1

Contexto regulatorio/estándar (anonimización)

RGPD Considerando 26: la información anónima queda fuera del RGPD; la detección se utiliza para permitir transformaciones (p. ej., difuminado) que impiden la identificabilidad. Cita: "Los principios de protección de datos no deben aplicarse, por tanto, a información anónima...". EUR-Lex+1

ISO/IEC 20889:2018: taxonomía de técnicas de desidentificación; la detección de objetos es el paso precursor que define ROIs para aplicar dichas técnicas. ISO+1

Métricas y atributos técnicos

Métricas de precisión

AP / mAP (COCO): AP promediado sobre umbrales de IoU 0.50:0.05:0.95, comúnmente reportado como mAP@[.5:.95]. arXiv+1

VOC [email protected]: métrica histórica de PASCAL VOC con IoU 0.5. homepages.inf.ed.ac.uk

Métricas de ejecución (para tiempo real)

Latencia de extremo a extremo: L_{e2e} = L_{grab} + L_{pre} + L_{model} + L_{post} + L_{io}

Rendimiento: fotogramas por segundo, con FPS_{proc} ≥ F_{video}

Jitter: varianza de L_{e2e}; se requiere jitter acotado en diseños de tiempo real estricto. course.ece.cmu.edu

Fórmulas (definiciones estándar)

Precisión = TP/(TP+FP), Exhaustividad = TP/(TP+FN); IoU = |B_{pred} ∩ B_{gt}| / |B_{pred} ∪ B_{gt}| (Como se usan en evaluación VOC/COCO). homepages.inf.ed.ac.uk+1

Tabla: objetivos de diseño clave para flujos de anonimización

Parámetro

Objetivo de diseño

Justificación / fuente

L_{e2e} (ms)

≤ 1000/F_{video}

el plazo en tiempo real equivale al período de muestreo course.ece.cmu.edu

Exhaustividad@IoU_p

maximizar (en IoU de política, típicamente 0,5–0,75)

minimizar falsos negativos para clases sensibles a privacidad; COCO/VOC definen umbrales IoU arXiv+1

mAP@[.5:.95]

monitoreado, secundario a Exhaustividad para clases sensibles

descripción de métrica COCO; riesgo de privacidad impulsado por FN arXiv

Estabilidad FPS

FPS_{proc} ≥ F_{video} con bajo jitter

requerido para anonimización ininterrumpida course.ece.cmu.edu

Conjuntos de datos y práctica de evaluación

MS COCO - AP/mAP@[.5:.95]; punto de referencia ampliamente adoptado. arXiv+1

PASCAL VOC - [email protected] y curvas PR como protocolo clásico. homepages.inf.ed.ac.uk

MOTChallenge (para seguimiento en vídeo) - métricas MOTA/IDF1 cuando la detección alimenta el seguimiento para estabilizar la anonimización entre fotogramas. SpringerLink+2MOT Challenge+2

Práctica e implementación (flujo de trabajo)

Captura → 2) preprocesamiento → 3) detección (modelos optimizados para TR, p. ej., familia YOLO) → 4) postprocesamiento (NMS) → 5) transformación de anonimización en ROIs → 6) salida. Los detectores "en tiempo real" modernos (p. ej., YOLOv7) demuestran precisión de vanguardia a altos FPS en hardware común y sirven como referencias prácticas. arXiv+1

Bibliografía

  • ISO/IEC 20889:2018 - Desidentificación de datos de mejora de la privacidad. ISO+1
  • RGPD Considerando 26 (EUR-Lex / texto completo). EUR-Lex
  • MS COCO - definiciones de métricas y documentación del conjunto. arXiv
  • PASCAL VOC - procedimientos de evaluación. homepages.inf.ed.ac.uk
  • Sistemas en tiempo real - definiciones y propiedades. course.ece.cmu.edu+1