Qu’est-ce qu’une piste d’audit de caviardage ?

Piste d’audit de caviardage : définition

La piste d’audit de caviardage correspond à la trace d’audit du processus de caviardage, c’est-à-dire à un enregistrement structuré et vérifiable des opérations réalisées lors de l’anonymisation ou de la pseudonymisation de contenus visuels - photos et vidéos - en particulier lors du floutage des visages et des plaques d’immatriculation. En pratique, il s’agit d’un ensemble de métadonnées et de journaux techniques permettant de répondre aux questions suivantes : qui a effectué l’opération, quand, sur quel fichier, selon quelle méthode, avec quel résultat, et si le contenu a été modifié après le caviardage.

Dans le contexte de la conformité au RGPD, la piste d’audit n’est pas une fin en soi. C’est un outil d’accountability au sens de l’article 5, paragraphe 2, du RGPD. Le responsable du traitement doit être en mesure de démontrer que le traitement a été effectué conformément aux principes de protection des données, notamment aux principes d’intégrité, de confidentialité et de minimisation des données. Dans un environnement d’anonymisation de photos et de vidéos, cela implique de documenter le processus de floutage sans créer dans les journaux des ensembles excessifs de données à caractère personnel.

Une piste d’audit de caviardage bien conçue ne doit pas dupliquer l’image d’un visage, le numéro d’une plaque ni d’autres données identifiantes. Elle doit en revanche documenter le déroulement du processus d’une manière utile sur le plan probatoire et opérationnel. Un tel enregistrement est important lors d’un audit interne, d’un contrôle de l’autorité de contrôle, de la gestion d’un incident, d’un litige judiciaire ou de la vérification de la qualité de fonctionnement de l’outil.

Comment comprendre la piste d’audit dans l’anonymisation des photos et vidéos ?

Dans le cas des contenus visuels, la piste d’audit couvre à la fois l’étape de détection automatique, l’étape de caviardage proprement dite ainsi que, le cas échéant, la correction manuelle. Cet aspect est essentiel, car l’efficacité de l’anonymisation dépend de l’ensemble de la chaîne de traitement, et pas uniquement du filtre de flou lui-même.

Si le système utilise un modèle d’IA pour détecter les visages ou les plaques d’immatriculation, la piste d’audit doit indiquer quel modèle a été utilisé, dans quelle version, avec quels paramètres de seuil de détection, et si le résultat a été validé manuellement par un opérateur. Pour les visages, on utilise généralement des modèles de détection fondés sur le deep learning, car les méthodes classiques sont moins robustes face aux variations d’angle, d’éclairage, à l’occultation partielle et à la faible qualité d’image. Le modèle d’IA, à lui seul, ne constitue pas encore une anonymisation. Il s’agit d’un composant qui localise les zones nécessitant un caviardage, avant qu’une étape ultérieure n’applique un masque, un flou ou une pixelisation.

La piste d’audit doit donc décrire le processus, et non le seul résultat final.

Que doit contenir un journal de floutage ?

Pour qu’un journal soit utile du point de vue du RGPD et du droit de la preuve, il doit être complet, cohérent et résistant aux modifications non autorisées. En même temps, il ne doit pas contenir de données à caractère personnel excessives. En pratique, il est recommandé de séparer le journal technique des données sources et de ne conserver que des identifiants, des empreintes cryptographiques et des paramètres de traitement.

L’ensemble minimal d’informations peut être présenté comme suit :

Élément du journal

Finalité

Observations de conformité

 

Identifiant de dossier / de tâche

Relier l’opération au processus métier

Sans divulguer les données de la personne figurant dans le contenu

Identifiant du fichier source

Identifier le contenu de manière univoque

Empreinte préférée, par exemple SHA-256 du fichier

Date et heure de l’opération

Reconstituer la séquence des actions

De préférence en UTC et avec synchronisation horaire

Identifiant de l’opérateur ou du processus

Assurer la traçabilité des actions

Pas de données personnelles complètes, mais un identifiant de compte

Type d’objet détecté

Distinguer les visages et les plaques

Sans enregistrer l’image de l’objet lui-même

Méthode de caviardage

Indiquer si un flou, une pixelisation ou un masque a été appliqué

Important pour évaluer l’efficacité

Version du modèle / du moteur

Garantir la reproductibilité et l’audit technique

Essentiel après une mise à jour du système

Paramètres du processus

Évaluer la qualité et assurer la reproductibilité

Seuil de détection, intensité du flou, plage d’images

Information sur la correction manuelle

Signaler l’intervention de l’opérateur

Important pour les contenus complexes

Empreinte du fichier de sortie

Vérifier l’intégrité du résultat

Aide à démontrer l’absence de modifications ultérieures

Exigences du RGPD et valeur probante

Du point de vue du RGPD, les principes les plus importants sont ceux de l’article 5, paragraphes 1 et 2, ainsi que la sécurité du traitement visée à l’article 32. Le simple fait de tenir des journaux ne dispense pas de l’obligation de minimisation. Si le journal contenait des vignettes de visages, les numéros complets des plaques ou des captures d’images, il pourrait devenir un nouveau fichier de données à caractère personnel nécessitant une base de traitement appropriée et des mesures de sécurité adaptées.

Du point de vue de la preuve, l’intégrité, l’authenticité et la capacité à démontrer la continuité des opérations sont essentielles. En pratique, les éléments suivants sont utiles :

Premièrement, les empreintes cryptographiques du fichier d’entrée et du fichier de sortie. Deuxièmement, un enregistrement immuable des événements ou des mécanismes de détection des modifications. Troisièmement, le contrôle d’accès et la journalisation des droits. Quatrièmement, un horodatage cohérent. Un tel modèle aide à démontrer qu’une version déterminée du contenu a été caviardée à un moment précis et par un processus déterminé.

Principaux paramètres et métriques d’une piste d’audit de caviardage

Le journal lui-même n’évalue pas la qualité de l’anonymisation, mais il doit enregistrer les métriques qui permettront cette évaluation. Dans les systèmes de traitement d’images et de vidéos, les paramètres de détection et l’exhaustivité du caviardage sont particulièrement importants.

En pratique, il est utile d’enregistrer :

  • la précision et le rappel du modèle de détection - s’ils sont mesurés sur les jeux de validation du fournisseur ou de l’organisation qui déploie la solution,
  • le nombre d’objets détectés par fichier ou par image,
  • le pourcentage d’objets corrigés manuellement,
  • le temps de traitement du fichier, par exemple en secondes par minute de vidéo,
  • le nombre d’images sans masque appliqué dans les séquences où l’objet était présent.

Dans les contenus à valeur probante ou à usage administratif, le taux d’omission, c’est-à-dire les faux négatifs, est particulièrement important. Si un visage ou une plaque n’a pas été détecté puis flouté, le caviardage peut être inefficace malgré un fonctionnement correct sur la majorité des images.

Limites et pratique de mise en œuvre

Tous les éléments du processus ne doivent pas nécessairement figurer dans le journal. Dans un environnement conforme au principe de privacy by design, il vaut mieux enregistrer moins de données, mais avec une valeur probante plus élevée. Cela concerne en particulier les systèmes on-premise, où l’administrateur garde un contrôle total sur la conservation, les droits d’accès et l’emplacement de stockage des journaux.

En pratique, Gallio PRO floute automatiquement les visages et les plaques d’immatriculation, mais ne détecte pas automatiquement les logos, les tatouages, les badges nominatifs, les documents ni l’image affichée sur des écrans. Ces éléments peuvent être caviardés manuellement dans l’éditeur. La piste d’audit doit donc distinguer les opérations automatiques des opérations manuelles. En même temps, le journal ne doit pas contenir de données à caractère personnel issues de la détection des visages et des plaques d’immatriculation.

Références normatives et sources

La définition et la portée de l’accountability doivent être rattachées avant tout au règlement (UE) 2016/679, c’est-à-dire au RGPD, adopté le 27 avril 2016 et applicable depuis le 25 mai 2018, notamment à l’article 5, paragraphe 2, ainsi qu’aux articles 24, 25 et 32. Dans le domaine de la sécurité de l’information, les normes ISO/IEC 27001:2022 et ISO/IEC 27002:2022 sont également utiles, car elles décrivent le contrôle d’accès, la journalisation des événements et l’intégrité de l’information. Pour la valeur probante, les règles procédurales nationales et les principes de préservation des contenus numériques sont également importants, mais leur application concrète dépend du type de procédure.

Concernant les plaques d’immatriculation, il existe en Pologne des divergences d’interprétation. Les positions des autorités de protection des données et la pratique de conformité penchent souvent vers la prudence et le floutage des plaques, tandis que la jurisprudence des juridictions administratives a parfois considéré qu’une plaque seule ne constitue pas toujours une donnée à caractère personnel. Dans les usages de conformité, il est donc plus sûr de documenter le fait du caviardage des plaques sans en conserver le contenu dans le journal.