Qu’est-ce que l’occlusion handling (gestion des visages partiellement masqués) ?

Occlusion handling (gestion des visages partiellement masqués) - définition

L’occlusion handling, ou gestion des visages partiellement masqués, désigne un ensemble de méthodes de détection, de suivi et de floutage correct des visages qui sont partiellement cachés sur une photo ou dans une vidéo. Dans le contexte de l’anonymisation, cela couvre les situations où le système doit reconnaître la présence d’un visage même lorsque tous ses traits ne sont pas visibles, par exemple lorsqu’il est dissimulé par un masque, des lunettes, une main, un casque, des cheveux, un poteau, un vêtement ou une autre personne.

D’un point de vue technique, il ne s’agit pas d’une technologie autonome, mais d’une propriété et d’un ensemble de procédures propres au modèle de détection de visages ainsi qu’à l’étape suivante d’anonymisation. L’objectif n’est pas d’identifier la personne, mais de maintenir un niveau élevé de détection des visages malgré une perte partielle d’informations visuelles. En pratique, cela signifie que le modèle d’IA doit apprendre à reconnaître un visage à partir de motifs géométriques et texturaux incomplets, puis transmettre sa localisation au module de floutage ou de masquage.

Dans les systèmes d’anonymisation de photos et de vidéos, l’occlusion handling a une importance directe pour la conformité du processus au principe de privacy by design prévu à l’article 25 du RGPD, car l’omission d’un visage partiellement masqué peut conduire à la divulgation involontaire de données personnelles. Dans les modèles fondés sur le deep learning, il est nécessaire d’entraîner au préalable le réseau de neurones sur des jeux de données contenant des cas d’occlusion partielle. Le simple recours à l’IA, sans modèle correctement préparé, ne suffit pas à résoudre ce problème.

Rôle de la gestion des visages partiellement masqués dans l’anonymisation des photos et des vidéos

Dans des conditions standard, la détection de visages repose sur un ensemble complet de caractéristiques, telles que les yeux, le nez, la bouche et le contour du visage. Lorsqu’une partie de ces éléments disparaît, le risque d’erreur de type false negative, c’est-à-dire de non-détection d’un visage pourtant présent dans l’image, augmente. Pour le processus d’anonymisation, il s’agit d’une erreur critique, car elle conduit à laisser un visage non flouté.

La gestion des visages partiellement masqués est particulièrement importante dans les images de vidéosurveillance, les enregistrements routiers, la documentation de terrain, les contenus issus d’événements publics et les vidéos réalisées en mouvement. Dans ce type de données, on rencontre souvent :

  • un profil de visage incomplet,
  • des occultations brèves d’une image à l’autre,
  • une faible résolution de l’objet,
  • de fortes variations d’éclairage,
  • le chevauchement de plusieurs personnes dans une même scène.

En pratique, une anonymisation réellement efficace exige que le système n’analyse pas chaque image indépendamment de son contexte. Dans les contenus vidéo, on utilise donc non seulement la détection, mais aussi le suivi d’objets entre les images, ce qui permet de maintenir le masque d’anonymisation même lorsque le visage disparaît partiellement pendant quelques images.

Technologies utilisées pour l’occlusion handling

Une gestion efficace des visages partiellement masqués repose généralement sur la combinaison de plusieurs couches de traitement. Dans les solutions modernes, la base est constituée de modèles de deep learning, le plus souvent des réseaux de neurones convolutifs ou des détecteurs à architecture en une étape et en deux étapes.

Les approches techniques les plus courantes sont les suivantes :

  • la détection de visages entraînée sur des jeux de données comportant des cas d’occlusion partielle,
  • l’estimation des points caractéristiques du visage, même lorsqu’une partie des landmarks n’est pas visible,
  • le suivi d’objet dans une séquence vidéo à l’aide de méthodes de type tracking-by-detection,
  • l’agrégation des résultats entre plusieurs images,
  • le seuillage de confiance avec une règle de sécurité supplémentaire pour les zones limites.

Dans la littérature scientifique, on utilise souvent le benchmark WIDER FACE, publié en 2016, qui couvre une grande variété d’échelles, de poses, d’expressions et d’occlusions du visage. Ce jeu de données est largement utilisé pour évaluer les détecteurs de visages dans des conditions de scène difficiles. Les résultats rapportés pour ce benchmark sont généralement exprimés en Average Precision (AP), séparément pour les niveaux Easy, Medium et Hard. La catégorie Hard comprend notamment les petits visages et les fortes occlusions.

Dans un système tel que Gallio PRO, l’occlusion handling doit être compris comme la capacité du module de détection automatique des visages à rester performant même en cas de masquage partiel. Si la détection automatique n’est pas suffisante pour un contenu donné, une correction peut être effectuée manuellement dans l’éditeur. Cela concerne toutefois uniquement les objets pris en charge ou marqués manuellement par l’utilisateur. Gallio PRO floute automatiquement les visages et les plaques d’immatriculation. En revanche, il ne détecte pas automatiquement les logos, les tatouages, les badges, les documents ni les contenus affichés sur les écrans de moniteurs.

Paramètres clés et métriques de l’occlusion handling

L’évaluation de la qualité de la gestion des visages partiellement masqués ne doit pas se limiter à l’efficacité globale de la détection. Des métriques mesurées sur des données comportant des occlusions partielles et fortes sont nécessaires. Dans le cas contraire, le résultat peut être trompeur du point de vue de l’anonymisation.

Paramètre / métrique

Signification

Importance pour l’anonymisation

 

Recall

Pourcentage de visages réellement présents détectés par le modèle

Indicateur le plus important pour limiter les omissions

Precision

Pourcentage de détections correctes parmi l’ensemble des détections

Influence le nombre de masques inutiles

AP sur un jeu de données avec occlusion

Précision moyenne calculée à partir de la courbe precision-recall selon un critère d’appariement donné, généralement avec un seuil d’IoU défini

Permet de comparer les modèles dans des conditions difficiles

IoU - Intersection over Union

Degré de recouvrement entre la boîte de détection et la zone de référence

Détermine si le floutage couvrira l’intégralité du visage

Latency

Temps de traitement d’une image ou d’un fichier

Important pour les traitements par lots et les systèmes quasi temps réel

False Negative Rate

Pourcentage de visages non détectés

Erreur présentant le plus haut risque juridique et opérationnel

De manière simplifiée, le recall peut s’écrire ainsi :

Recall = TP / (TP + FN)

où TP désigne les visages correctement détectés et FN les visages omis. Dans les usages liés à la protection de la vie privée, on privilégie généralement une configuration qui augmente le recall, même au prix d’une hausse modérée des false positives, car un floutage excessif est en général moins risqué qu’une absence d’anonymisation.

Défis et limites de la gestion des visages partiellement masqués

Même les bons modèles ont leurs limites. Le problème s’aggrave lorsque l’occlusion se combine à une petite taille du visage, au flou de mouvement, à un faible contraste et à un angle de caméra atypique. Dans ces conditions, le système peut considérer à tort que l’objet ne contient pas suffisamment d’indices pour être classé comme un visage.

Les limitations les plus fréquentes sont les suivantes :

  • une occlusion importante dépassant le seuil d’information exploitable par le modèle,
  • une instabilité de la détection entre deux images consécutives,
  • une baisse de qualité pour les très petits visages,
  • une forte dépendance à la qualité des données d’entraînement,
  • des écarts entre le benchmark et le matériel source réel.

Pour cette raison, le processus d’anonymisation doit intégrer une validation qualitative, le choix d’un seuil de confiance adapté et, pour les contenus à risque élevé, un contrôle par opérateur. Cela est particulièrement important lorsque l’enregistrement doit être publié ou transmis à un tiers.

Références normatives et contexte pratique de conformité

La gestion des visages partiellement masqués n’est pas définie séparément dans le RGPD ni dans les normes ISO comme une obligation technique autonome. Son importance découle toutefois des principes généraux relatifs au traitement des données personnelles et à la sécurité du traitement. Sont notamment applicables :

  • le Règlement (UE) 2016/679 du Parlement européen et du Conseil - RGPD, en particulier les articles 5, 25 et 32,
  • ISO/IEC 23894:2023 - Artificial intelligence - Guidance on risk management,
  • ISO/IEC 27001:2022 - système de management de la sécurité de l’information,
  • NIST AI RMF 1.0, 2023 - lignes directrices pour la gestion des risques des systèmes d’IA.

Du point de vue du DPO, l’évaluation pratique doit inclure non seulement la question de savoir si le système détecte les visages, mais aussi son comportement en cas d’occlusion, son niveau de recall sur des données difficiles et l’existence d’une procédure de correction manuelle. Dans le cas de Gallio PRO, il est également important de noter que la solution fonctionne comme un logiciel on-premise, qu’elle ne réalise ni anonymisation de flux vidéo ni anonymisation en temps réel, et qu’elle ne collecte pas de journaux contenant des détections de visages et de plaques d’immatriculation.