Qu’est-ce que le masquage des données personnelles (PII - Personally Identifiable Information) ?

Masquage des données personnelles (PII) - définition

Le masquage des données personnelles (PII) dans le contexte des images et des vidéos est un processus technique contrôlé visant à dissimuler de manière permanente les éléments du cadre permettant d’identifier une personne physique. Dans l’Union européenne, la notion de PII correspond en pratique au champ des « données à caractère personnel » défini à l’article 4, paragraphe 1 du Règlement (UE) 2016/679 (RGPD), c’est‑à‑dire toute information se rapportant à une personne identifiée ou identifiable. Dans les contenus visuels, les principaux identifiants sont notamment les visages et les plaques d’immatriculation des véhicules. Le masquage est appliqué afin de réduire le risque de ré‑identification et de respecter les principes de minimisation des données et de nécessité du traitement.

Une anonymisation efficace, conformément aux lignes directrices des autorités (WP29, EDPB, CNIL), exige que le processus soit pratiquement irréversible au moyen de moyens raisonnablement disponibles. Cela implique de choisir des méthodes et des paramètres de floutage de manière à empêcher l’identification d’une personne, isolément ou par recoupement d’informations, tout en préservant l’utilité du contenu pour l’objectif déclaré.

Rôle du masquage des données personnelles dans l’anonymisation des images et des vidéos

Le masquage des PII constitue une mesure fondamentale de réduction des risques dans les domaines de la vidéosurveillance, de la publication de contenus de presse, de l’archivage d’études UX et du partage de jeux de données d’entraînement pour l’IA. Le CEPD (EDPB) souligne que le traitement de données issues de dispositifs vidéo doit respecter le principe de proportionnalité et la limitation des finalités, et que la divulgation de visages ou de numéros de véhicules nécessite une base juridique ainsi qu’une adéquation avec l’objectif de la publication.

  • Visages : l’image d’une personne constitue une donnée à caractère personnel. Lorsqu’elle est utilisée pour une identification unique fondée sur des caractéristiques biométriques (par exemple dans les systèmes de reconnaissance faciale), les données traitées peuvent relever des données biométriques, catégorie particulière de données au sens de l’article 9 du RGPD.
  • Plaques d’immatriculation : dans de nombreux États membres de l’UE, les autorités de contrôle les considèrent comme des données personnelles lorsqu’elles permettent d’identifier le propriétaire ou l’utilisateur du véhicule via des registres accessibles. En Pologne, les interprétations varient selon le contexte de traitement ; en pratique, le masquage est recommandé lors de la mise à disposition publique.
  • Exceptions à l’obligation de consentement pour la diffusion de l’image découlent du droit d’auteur (art. 81) : personne publique, image accessoire d’un ensemble plus large (par ex. un rassemblement) ou consentement accordé contre rémunération.

Technologies de masquage des données personnelles dans l’image et la vidéo

L’automatisation du masquage des données personnelles dans les images et les vidéos repose sur la détection et la localisation d’objets dans les images ainsi que sur un traitement spatio‑temporel. Les modèles de détection des visages et des plaques d’immatriculation s’appuient sur l’apprentissage profond, notamment les réseaux de neurones convolutionnels, les architectures de détection one‑stage et two‑stage, ainsi que des modèles plus récents basés sur les transformeurs. Le modèle d’IA déployé est ensuite utilisé opérationnellement pour identifier les zones à masquer.

  • Détection et suivi : détection image par image, puis suivi des objets dans le temps afin d’assurer la cohérence du masque (algorithmes SORT, DeepSORT ou équivalents).
  • Extension de la région : ajout d’une marge autour de la détection pour compenser les erreurs de localisation et les mouvements de caméra.
  • Méthodes de dissimulation : flou gaussien, pixellisation (mosaïque), remplissage uniforme ou texturé. Le choix des paramètres doit minimiser le risque de réversibilité et de ré‑identification.
  • Traitement on‑premise : limite le transfert de données vers des tiers et facilite le contrôle de la chaîne de traitement.

Un logiciel de la classe Gallio PRO masque automatiquement uniquement les visages et les plaques d’immatriculation. Il ne réalise pas d’anonymisation en temps réel ni d’anonymisation de flux vidéo. Le masquage de logos, de tatouages ou de documents dans les enregistrements est possible manuellement via l’éditeur. Le système ne conserve pas de journaux contenant des détections de visages ou de plaques, ni d’autres données à caractère personnel.

Paramètres clés et indicateurs de qualité du masquage

L’évaluation de la qualité du masquage des données personnelles combine des métriques de détection, de localisation et de performance de calcul, ainsi que des tests de résistance en matière de protection de la vie privée. Le tableau ci‑dessous présente les indicateurs les plus couramment utilisés dans les projets d’anonymisation d’images et de vidéos.

Métrique

Définition

Importance pour la vie privée

 

Précision

TP / (TP + FP)

Un faible taux de faux positifs limite le masquage excessif.

Rappel

TP / (TP + FN)

Critique : réduit le risque de laisser un visage ou une plaque non masqués.

F1

2 × Précision × Rappel / (Précision + Rappel)

Équilibre l’efficacité et la justesse des détections.

IoU

Intersection / Union des zones détectées et de référence

Vérifie que le masque couvre entièrement la zone identifiante.

mAP

Moyenne de l’AP selon différents seuils d’IoU

Indication globale de la qualité du détecteur.

Latence

ms/image ou ms/frame

Planification des ressources ; importante pour le traitement par lots.

Débit

images/s ou frames/s

Mise à l’échelle en production et respect des SLA.

Test de réversibilité

Évaluation de la vulnérabilité au défloutage et à la super‑résolution

Valide l’irréversibilité de la transformation (exigence de l’anonymisation).

Audits manuels

Revue d’échantillons à risque

Identifie les cas limites non détectés par les métriques.

Défis et limites

Le masquage des données personnelles dans les images et les vidéos présente des défis techniques et juridiques. La qualité de la détection diminue en cas de faible luminosité, de mouvements importants, d’occlusions, d’angles défavorables ou de basse résolution. Une localisation imprécise entraîne un masquage insuffisant, tandis que des filtres trop agressifs réduisent l’utilité du contenu. La pixellisation et un flou léger peuvent être partiellement réversibles à l’aide d’algorithmes de super‑résolution ; les paramètres doivent donc être choisis de manière conservatrice. L’automatisation couvre généralement uniquement les visages et les plaques d’immatriculation ; d’autres éléments de PII nécessitent une édition manuelle et des procédures de contrôle qualité. Par ailleurs, les différences d’interprétation juridique (par ex. concernant les plaques d’immatriculation en Pologne) imposent des politiques de conformité adaptées à la juridiction et à la finalité du traitement.

Références normatives et sources

Les textes ci‑dessous rassemblent les principaux actes et normes qui définissent les exigences et les bonnes pratiques relatives au masquage des données personnelles dans les contenus visuels. Ils précisent les notions de données personnelles, les critères d’une anonymisation efficace et les cadres de gouvernance de la vie privée.

  • RGPD - Règlement (UE) 2016/679, art. 4 §1 et art. 9. Texte officiel : https://eur-lex.europa.eu/eli/reg/2016/679/oj
  • EDPB, Guidelines 3/2019 on processing of personal data through video devices (adoptées le 29/01/2020) : https://edpb.europa.eu/our-work-tools/our-documents/guidelines/guidelines-32019-processing-personal-data-through-video_en
  • Groupe de travail Article 29, Opinion 05/2014 on Anonymisation Techniques : https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2014/wp216_en.pdf
  • ISO/IEC 20889:2018, Privacy enhancing data de-identification terminology and classification : https://www.iso.org/standard/69373.html
  • ISO/IEC 29100:2011, Privacy framework : https://www.iso.org/standard/45123.html
  • CNIL, Anonymisation - guide et méthodologie (mises à jour) : https://www.cnil.fr/fr/lanonymisation
  • ICO, Anonymisation guidance (2022+) : https://ico.org.uk/for-organisations/uk-gdpr-guidance-and-resources/anonymisation/
  • Loi sur le droit d’auteur et les droits voisins, art. 81 (image) : https://isap.sejm.gov.pl/isap.nsf/DocDetails.xsp?id=WDU19940240083