Définition
La détection d'objets en temps réel (real-time object detection) est la détection et la localisation d'objets dans un flux d'images/vidéo sous une contrainte temporelle n'excédant pas l'intervalle d'échantillonnage/frame. Pour un flux de fréquence F_{video} [Hz], la latence de bout en bout doit satisfaire L_{e2e} ≤ 1/F_{video}. Ceci découle du principe des systèmes temps réel selon lequel la correction dépend de l'achèvement dans les délais spécifiés.
Contexte réglementaire/normatif (anonymisation)
- RGPD Considérant 26 : Les informations anonymes ne relèvent pas du RGPD ; la détection est utilisée pour permettre des transformations (par exemple, floutage) qui empêchent l'identification. Citation : « Les principes de protection des données ne devraient par conséquent pas s'appliquer aux informations anonymes… »
- ISO/IEC 20889:2018 : Taxonomie des techniques de dé-identification ; la détection d'objets est l'étape préalable qui définit les régions d'intérêt (ROI) pour l'application de ces techniques
Métriques et attributs techniques
Métriques de précision
- AP / mAP (COCO) : AP moyenné sur les seuils IoU de 0.50:0.05:0.95, communément rapporté comme mAP@[.5:.95]
- VOC [email protected] : Métrique historique PASCAL VOC avec seuil IoU de 0.5
Métriques d'exécution (pour le temps réel)
- Latence de bout en bout : L_{e2e} = L_{grab} + L_{pre} + L_{model} + L_{post} + L_{io}
- Débit (Throughput) : Images par seconde, avec FPS_{proc} ≥ F_{video}
- Gigue (Jitter) : Variance de L_{e2e} ; une gigue bornée est requise dans les conceptions temps réel dur
Formules (définitions standard)
- Précision = TP/(TP+FP)
- Rappel = TP/(TP+FN)
- IoU = |B_{pred} ∩ B_{gt}| / |B_{pred} ∪ B_{gt}|
(Telles qu'utilisées dans l'évaluation VOC/COCO)
Tableau : Cibles de conception clés pour les pipelines d'anonymisation
Paramètre | Cible de conception | Justification / source |
|---|---|---|
L_{e2e} (ms) | ≤ 1000/F_{video} | La deadline temps réel égale la période d'échantillonnage |
Recall@IoU_p | Maximiser (à l'IoU de politique, typiquement 0.5–0.75) | Minimiser les faux négatifs pour les classes sensibles pour la vie privée ; COCO/VOC définissent les seuils IoU |
mAP@[.5:.95] | Surveillé, secondaire au Rappel pour les classes sensibles | Description de métrique COCO ; risque de vie privée déterminé par les FN |
Stabilité FPS | FPS_{proc} ≥ F_{video} avec faible gigue | Requis pour anonymisation ininterrompue |
Jeux de données et pratiques d'évaluation
- MS COCO - AP/mAP@[.5:.95] ; référence largement adoptée
- PASCAL VOC - [email protected] et courbes PR comme protocole classique
- MOTChallenge (pour le suivi sur vidéo) - Métriques MOTA/IDF1 lorsque la détection alimente le suivi pour stabiliser l'anonymisation à travers les frames
Pratique et mise en œuvre (pipeline)
Pipeline type :
- Capture
- Prétraitement
- Détection (modèles optimisés temps réel, par exemple, famille YOLO)
- Post-traitement (NMS - Non-Maximum Suppression)
- Transformation d'anonymisation sur les ROI
- Sortie
Les détecteurs "temps réel" modernes (par exemple, YOLOv7, YOLOv8, YOLO11) démontrent une précision de pointe à FPS élevé sur du matériel standard et servent de références pratiques.
Notes d'expert
Criticité pour l'anonymisation
Dans le contexte de l'anonymisation :
- Le Rappel prime sur la Précision : Un faux négatif (visage non détecté) constitue une violation de vie privée, tandis qu'un faux positif (sur-masquage) réduit seulement l'utilité
- Latence critique : Le non-respect de L_{e2e} ≤ 1/F_{video} entraîne l'accumulation de frames non traitées et l'exposition potentielle de données sensibles
- Stabilité requise : La gigue (variance de latence) peut créer des frames intermittentes non anonymisées
Compromis architecture
Type de détecteur | Latence | Précision | Usage anonymisation |
|---|---|---|---|
Single-stage (YOLO, SSD) | Faible (< 20 ms) | Élevée | Temps réel standard |
Two-stage (Faster R-CNN) | Élevée (> 50 ms) | Très élevée | Post-production, archives |
Lightweight (MobileNet, Tiny) | Très faible (< 10 ms) | Moyenne | Edge computing, IoT |
Considérations pratiques
Optimisation matérielle : L'accélération GPU (CUDA, TensorRT) ou dédiée (TPU, NPU) est essentielle pour respecter les contraintes temps réel sur flux HD/4K.
Monitoring continu : Les pipelines d'anonymisation doivent instrumenter L_{e2e}, FPS_{proc} et métriques de détection pour garantir la conformité continue.
Gestion des cas limites : Occlusions, éclairages extrêmes, angles inhabituels peuvent dégrader le Rappel - nécessite des modèles robustes et éventuellement des modules de secours.
Bibliographie
- ISO/IEC 20889:2018 - Privacy enhancing data de-identification
- RGPD Considérant 26 (EUR-Lex / texte complet)
- MS COCO - Définitions des métriques et documentation du jeu de données
- PASCAL VOC - Procédures d'évaluation
- Real-time systems - Définitions et propriétés
- YOLOv7 et architectures récentes - État de l'art en détection temps réel