Qu’est-ce que le confidence threshold (seuil de confiance de détection) ?

Confidence threshold : définition

Le confidence threshold, ou seuil de confiance de détection, est un paramètre utilisé dans les modèles de vision par ordinateur qui définit le niveau minimal de confiance exigé pour considérer qu’un objet détecté constitue une détection valide. Dans la pratique de l’anonymisation des photos et des vidéos, il s’agit principalement de détecter les visages et les plaques d’immatriculation avant leur floutage ou masquage automatique.

Un modèle de détection renvoie généralement, pour chaque objet, deux types d’informations : la position de l’objet dans l’image, le plus souvent sous la forme d’une boîte englobante, ainsi qu’une valeur appelée confidence score, c’est-à-dire une estimation numérique du degré de confiance indiquant que la zone concernée contient bien un visage ou une plaque. Le confidence threshold fixe la frontière de décision. Si le score du modèle est égal ou supérieur au seuil, l’objet est retenu pour un traitement ultérieur. Si le score est inférieur, la détection est rejetée.

Dans les systèmes d’anonymisation, ce paramètre a un impact direct sur le risque de deux classes d’erreurs : le false positive, lorsqu’un objet qui n’est ni un visage ni une plaque est flouté, et le false negative, lorsqu’un visage ou une plaque réel n’est pas détecté et n’est donc pas anonymisé. Du point de vue de la protection de la vie privée, les false negatives constituent généralement l’erreur la plus critique, car ils signifient la divulgation de données personnelles dans un contenu visuel.

Rôle du seuil de confiance de détection dans l’anonymisation des photos et vidéos

Dans le contexte de l’anonymisation des contenus visuels, le seuil de confiance de détection n’est pas un simple réglage technique. C’est un paramètre qui a des implications pour la conformité du processus aux exigences de protection des données ainsi que pour la qualité opérationnelle du traitement. Plus le seuil est bas, plus le nombre d’objets marqués comme visages ou plaques d’immatriculation est élevé. Cela augmente généralement la sensibilité de détection, mais accroît aussi le nombre de faux positifs.

Plus le seuil est élevé, plus le système fonctionne de manière restrictive et n’accepte que les détections présentant un niveau de confiance élevé. Cela limite le floutage excessif, mais peut entraîner l’omission d’objets difficiles à détecter, par exemple des visages de petite taille, partiellement masqués, des plaques dans de mauvaises conditions d’éclairage ou encore des plaques vues en angle.

En pratique, le seuil est défini en fonction de l’objectif du processus :

  • pour une anonymisation visant avant tout à minimiser le risque de divulgation de données, on choisit généralement un seuil plus bas assorti d’un contrôle qualité complémentaire ;
  • pour des contenus de haute qualité d’image, un seuil plus élevé peut être utilisé si la validation confirme le maintien d’un niveau de recall satisfaisant ;
  • des seuils distincts peuvent être appliqués selon les classes d’objets, par exemple pour les visages et pour les plaques d’immatriculation.

Fonctionnement technique du confidence threshold

Les systèmes modernes de détection des visages et des plaques d’immatriculation s’appuient généralement sur des modèles de deep learning, le plus souvent des réseaux neuronaux convolutifs ou d’autres architectures contemporaines de détection. Le deep learning constitue ici une approche typique lors de la construction d’un modèle d’IA, car c’est sur des jeux de données d’entraînement que le modèle apprend les caractéristiques visuelles lui permettant de reconnaître les visages et les plaques dans des conditions variées. Le modèle final est ensuite utilisé dans le processus de floutage automatique.

Le confidence score n’est pas toujours une probabilité calibrée au sens statistique. Dans de nombreuses architectures, il s’agit d’une valeur obtenue après l’application d’une fonction sigmoid ou softmax, mais son interprétation dépend de la manière dont le modèle a été entraîné et validé. Pour cette raison, le seuil ne doit pas être défini uniquement de façon intuitive. Il doit résulter de tests réalisés sur un échantillon représentatif des données réelles en entrée.

La règle de décision typique prend la forme suivante :

détection acceptée si score >= threshold

Après cette étape, des procédures complémentaires sont souvent appliquées, par exemple le Non-Maximum Suppression, qui supprime les boîtes qui se chevauchent pour un même objet. Cela influe sur le nombre final de détections, et il faut garder à l’esprit que le résultat final ne dépend pas uniquement du threshold, mais aussi des autres paramètres de la chaîne de détection.

Paramètres clés et métriques liés au confidence threshold

L’évaluation de la pertinence du réglage du seuil nécessite une mesure de la qualité. Dans les tâches de détection d’objets, on utilise des métriques largement décrites dans la littérature et dans des benchmarks tels que PASCAL VOC et COCO. Dans l’anonymisation, les métriques les plus importantes sont celles qui montrent à quelle fréquence le système omet des objets devant être masqués.

Métrique

Signification pratique

Impact d’un changement de threshold

 

Precision

Part des détections acceptées qui sont correctes

Un threshold plus élevé augmente généralement la precision

Recall

Part des objets réels effectivement détectés

Un threshold plus faible augmente généralement le recall

F1-score

Moyenne harmonique de la precision et du recall

Aide à trouver un compromis

False Discovery Rate

Niveau de faux marquages parmi les détections acceptées

Augmente lorsque le threshold est trop faible

False Negative Rate

Niveau d’omission des visages ou des plaques

Augmente lorsque le threshold est trop élevé

mAP à IoU 0.5 ou 0.5:0.95

Qualité globale du détecteur dans les benchmarks

Sert à évaluer le modèle, mais ne remplace pas le choix du threshold

Dans les tâches de protection de la vie privée, le recall revêt une importance particulière. Si le recall pour les visages ou les plaques d’immatriculation est trop faible, une partie des données personnelles restera visible. C’est pourquoi le confidence threshold optimal n’est pas toujours celui qui maximise la precision ou la mAP.

Choix pratique du seuil dans les systèmes d’anonymisation

Le choix du seuil doit reposer sur une validation effectuée sur des données proches des contenus réellement traités. La résolution, l’angle de caméra, la compression, le moment de la journée, les conditions météorologiques et le degré d’occlusion des objets sont des facteurs déterminants. Un seuil choisi sur un jeu de données de laboratoire peut ne pas fonctionner correctement sur des enregistrements de vidéosurveillance, des caméras mobiles ou des photos prises avec un smartphone.

En pratique, il est recommandé de :

  • tester séparément les visages et les plaques d’immatriculation ;
  • établir des courbes precision-recall pour plusieurs niveaux de threshold ;
  • choisir le seuil sur la base d’un niveau de false negative acceptable ;
  • procéder à une revalidation périodique après un changement de modèle, de caméra, de codec ou de scénario d’usage ;
  • appliquer un contrôle manuel dans les cas limites.

Dans le logiciel Gallio PRO, la détection automatique concerne les visages et les plaques d’immatriculation. Le système ne détecte pas automatiquement les logos, les tatouages, les badges nominatifs, les documents ni le contenu affiché sur les écrans de moniteurs. Ces éléments peuvent être masqués manuellement dans l’éditeur intégré. Cela signifie que même un confidence threshold correctement réglé ne supprime pas la nécessité d’évaluer le contenu au regard d’autres identifiants visuels.

Limites et contexte de conformité

Le seuil de confiance de détection ne garantit pas une anonymisation complète. Il ne s’agit que d’un des paramètres du système de détection. Le résultat dépend aussi de la qualité du modèle, des données d’entraînement, de la méthode d’annotation, de la taille minimale des objets, du prétraitement ainsi que des paramètres de suivi entre les images dans un contenu vidéo.

Du point de vue de la conformité au RGPD, il est essentiel d’adopter une approche fondée sur les risques et de sélectionner des mesures techniques adaptées à la finalité du traitement. Le règlement (UE) 2016/679 ne fixe aucune valeur précise pour le confidence threshold, mais impose la mise en œuvre de mesures techniques et organisationnelles appropriées conformément aux articles 24, 25 et 32. En pratique, cela implique de documenter les tests d’efficacité de l’anonymisation et de justifier les paramètres retenus.

Pour les contenus comprenant des plaques d’immatriculation, il faut également tenir compte du contexte juridique et factuel. Un numéro d’immatriculation ne constitue pas toujours une donnée personnelle, mais il peut le devenir s’il permet, à l’aide de moyens raisonnablement susceptibles d’être utilisés, d’identifier une personne physique. En pratique, leur floutage est souvent appliqué comme mesure de précaution, en particulier lorsque le contenu doit être diffusé plus largement.

Références normatives et sources

La notion de confidence threshold ne fait pas l’objet d’une définition normative unique dans un texte juridique, mais sa signification technique est cohérente avec la pratique du machine learning et de la détection d’objets. Lors des déploiements, il est conseillé de s’appuyer sur des sources primaires, la documentation des modèles et des benchmarks reconnus.

  • Règlement (UE) 2016/679, RGPD - articles 24, 25 et 32.
  • NIST IR 8280, Factsheets for AI and Automated Decision Systems, 2021 - importance de la documentation des paramètres et des limites des systèmes d’IA.
  • PASCAL VOC Challenge - Everingham et al., International Journal of Computer Vision, 2010 - métriques precision, recall et AP pour la détection d’objets.
  • COCO Detection Evaluation, Microsoft COCO - définitions utilisées de l’AP et de l’IoU pour l’évaluation des détecteurs.
  • Guo et al., On Calibration of Modern Neural Networks, ICML 2017 - limites de l’interprétation du score comme probabilité calibrée.