Qu’est-ce que l’apprentissage automatique (Machine Learning, ML) ?

Table des matières

Apprentissage automatique - définition
Rôle du ML dans l’anonymisation d’images et de vidéos
Technologies et architectures ML pour la détection des visages et des plaques
Paramètres et métriques clés pour l’anonymisation basée sur le ML
Défis et limites
Exemples d’applications
Références normatives et sources

Apprentissage automatique - définition

L’apprentissage automatique (Machine Learning, ML) désigne un ensemble de méthodes permettant aux systèmes informatiques d’identifier des motifs à partir de données et de prendre des décisions sans programmation explicite de règles. La norme internationale ISO/IEC 22989:2022 définit le ML comme une approche de l’intelligence artificielle dans laquelle les modèles améliorent leurs performances sur une tâche donnée grâce à l’expérience issue des données (source : ISO/IEC 22989:2022). Le cadre de gestion des risques du NIST (AI RMF 1.0) met en avant le cycle de vie des systèmes d’IA, y compris les composants de machine learning, couvrant notamment la préparation des données, l’entraînement, la validation, le déploiement et la surveillance (source : NIST AI RMF 1.0, 2023).

Dans le contexte de l’anonymisation d’images et de vidéos, le ML sert à détecter automatiquement les éléments nécessitant un masquage. Il s’agit le plus souvent des visages et des plaques d’immatriculation. Un modèle entraîné sur des données annotées identifie ces objets dans les images ou les séquences vidéo et renvoie leur position ainsi qu’un niveau de confiance. Les résultats de détection sont ensuite utilisés pour générer des masques de floutage ou de pixellisation, réduisant ainsi le risque d’identification des personnes ou des véhicules, conformément au RGPD et aux lignes directrices des autorités de contrôle (sources : EDPB 3/2019, WP29 05/2014, ISO/IEC 20889:2018).

Rôle du ML dans l’anonymisation d’images et de vidéos

Une anonymisation efficace des images repose sur une localisation fiable des éléments sensibles. Les règles basées sur de simples heuristiques s’avèrent insuffisantes face à des conditions d’éclairage variables, des prises de vue issues de caméras mobiles ou des occultations partielles. Le deep learning, sous-domaine du machine learning, offre une meilleure robustesse grâce à l’entraînement sur de vastes ensembles de données de référence. Pour automatiser le floutage, il est nécessaire de développer un modèle de détection présentant un niveau adéquat de sensibilité et de précision, puis de l’intégrer dans le flux de traitement.

Dans une chaîne de traitement typique, les étapes comprennent : le décodage vidéo, la détection d’objets, éventuellement le suivi inter-images, la génération de masques et l’exportation. Gallio PRO automatise la détection et le floutage exclusivement des visages et des plaques d’immatriculation. Le logiciel ne détecte pas automatiquement les logos, tatouages, badges nominatifs ni les contenus d’écrans ; ces éléments peuvent être floutés manuellement via l’éditeur. L’outil fonctionne en mode batch et non en temps réel. Un déploiement on-premise permet un traitement interne à l’organisation et limite le transfert de données. Gallio PRO ne conserve pas de journaux de détection contenant des données personnelles ou sensibles.

Technologies et architectures ML pour la détection des visages et des plaques

La détection d’objets dans les images repose principalement sur des réseaux neuronaux profonds. Le choix de l’architecture dépend du compromis entre qualité et rapidité, ainsi que des ressources de calcul disponibles (CPU, GPU). Les modèles sont entraînés de manière supervisée sur des ensembles annotés par boîtes englobantes ou masques.

Réseaux convolutifs de détection - notamment Faster R-CNN, RetinaNet, YOLOv3 et les versions plus récentes de YOLO (YOLOv5 à YOLOv8) - performants pour la détection de visages et de plaques, largement utilisés dans les applications à faible latence (sources : Ren 2015, Lin 2017, Redmon 2018).
Transformers de vision - tels que DETR et ses variantes - simplifient l’étape d’association des prédictions, au prix d’exigences computationnelles plus élevées ; adaptés aux scènes complexes (source : Carion 2020).
Segmentation - utilisée lorsque des masques de forme irrégulière sont requis ; pour le floutage des visages et plaques, des boîtes rectangulaires sont généralement suffisantes.
Suivi d’objets - stabilise les masques entre les images successives et réduit le scintillement ; souvent appliqué en post-traitement.
Préparation des données - des jeux de données tels que WIDER FACE ou des bases spécialisées en plaques d’immatriculation servent de référence pour l’évaluation des performances (source : Yang 2016 ; pratiques de benchmark).

Paramètres et métriques clés pour l’anonymisation basée sur le ML

L’évaluation des modèles influence directement le risque de divulgation d’identité et les coûts opérationnels. Les métriques ci-dessous sont couramment utilisées en détection d’objets et en inférence.

Métrique	Définition	Unité / plage	Source
Précision (Precision)	TP/(TP+FP)	0-1	Powers 2011
Rappel (Recall)	TP/(TP+FN)	0-1	Powers 2011
mAP	Moyenne des AP par classe (et selon le benchmark, par seuils IoU)	0-1	COCO, Lin 2014
IoU	Rapport entre l’aire d’intersection et l’aire d’union entre la détection et la vérité terrain	0-1	COCO, Lin 2014
Taux de faux positifs (FPR)	FP/(FP+TN)	0-1	Powers 2011
Latence d’inférence	Temps de traitement d’une image	ms	MLPerf Inference v3.0
Débit (Throughput)	Nombre d’images par seconde	fps	MLPerf Inference v3.0

En pratique, pour l’anonymisation, un rappel élevé est souvent plus critique que la précision : une non-détection comporte un risque supérieur à un floutage excessif. Le choix du seuil de confiance doit être documenté et justifié dans une analyse de risques conforme à ISO/IEC 23894:2023 et au NIST AI RMF 1.0.

Défis et limites

Les modèles peuvent présenter un rappel réduit en cas d’occultations, d’angles atypiques ou de faible résolution. L’équilibre entre rappel et précision nécessite un ajustement approprié du seuil et, le cas échéant, l’intégration d’un suivi d’objets. Des données d’entraînement biaisées géographiquement ou techniquement peuvent limiter la généralisation ; des audits de données et une validation croisée sont alors nécessaires. L’absence de traitement en temps réel implique une planification des lots et une gestion attentive des ressources GPU et des entrées/sorties.

Les aspects juridiques dépendent du contexte. L’obligation de flouter les plaques d’immatriculation varie selon la finalité et la base légale du traitement, ainsi que selon la possibilité d’identifier une personne à partir de la plaque ; il n’existe pas d’obligation générale uniforme dans le droit de l’UE pour tous les usages. En France et dans l’UE, le statut des plaques comme données personnelles s’apprécie au cas par cas, les lignes directrices des autorités de protection des données et la jurisprudence de la CJUE soutenant une approche prudente en cas de risque d’identification. L’obligation d’anonymiser les visages ne découle pas automatiquement du RGPD : elle dépend de la base juridique et du respect des principes de traitement. Par ailleurs, la diffusion d’une image peut relever du droit à l’image et du droit d’auteur, avec des exceptions classiques (personne publique dans l’exercice de ses fonctions, personne accessoire dans une scène d’ensemble, ou rémunération pour la pose). Du point de vue de la protection des données, la minimisation des journaux de détection et le déploiement on-premise soutiennent les principes de privacy by design.

Exemples d’applications

Le machine learning soutient l’anonymisation des enregistrements issus de la vidéosurveillance, des dashcams et des caméras mobiles, notamment lors du traitement des demandes d’accès aux données au titre du RGPD, de la communication de preuves dans des procédures, de la publication de contenus d’événements publics ou de l’archivage de supports pédagogiques. Dans chaque cas, des métriques auditables, le contrôle du seuil de détection et la possibilité d’édition manuelle sont essentiels. Dans des environnements à fortes exigences de sécurité, un traitement on-premise réduit la surface de risque.

Références normatives et sources

ISO/IEC 22989:2022 - Artificial Intelligence - Concepts and terminology.
ISO/IEC 23894:2023 - Artificial Intelligence - Risk management.
ISO/IEC 20889:2018 - Privacy enhancing data de-identification - Terminology and classification of techniques.
NIST AI Risk Management Framework 1.0, 2023.
Règlement (UE) 2016/679 (RGPD) - art. 4 et considérants relatifs aux données personnelles.
European Data Protection Board, Guidelines 3/2019 on processing of personal data through video devices, version 2.0, 2020.
Article 29 Working Party, Opinion 05/2014 on Anonymisation Techniques, 2014.
Lin et al., Microsoft COCO: Common Objects in Context, ECCV 2014.
Yang et al., WIDER FACE: A Face Detection Benchmark, CVPR 2016.
MLCommons, MLPerf Inference v3.0 Results and Rules, 2023.
Ren et al., Faster R-CNN, NIPS 2015 ; Redmon et al., YOLOv3, 2018 ; Carion et al., DETR, ECCV 2020.

Voir aussi

Retour au glossaire

Qu’est-ce que l’apprentissage automatique (Machine Learning, ML) ?