Qu’est-ce que la rédaction vidéo assistée par l’IA ?

Rédaction vidéo assistée par l’IA : définition

La rédaction vidéo assistée par l’IA désigne la rédaction automatique de contenus vidéo à l’aide de modèles d’intelligence artificielle, utilisée pour détecter et masquer de manière durable certains éléments de l’image, principalement les visages et les plaques d’immatriculation. Dans la pratique de l’anonymisation des photos et des enregistrements, il s’agit d’un processus dans lequel le système localise d’abord les objets susceptibles de permettre l’identification d’une personne, puis applique un masque, un flou ou un autre effet rendant difficile, voire impossible, la lecture des données visuelles.

Dans le contexte de la protection des données, il ne s’agit ni d’une simple « amélioration de l’image » ni d’un montage créatif. L’objectif est de réduire le risque d’identification d’une personne physique en supprimant ou en occultant les identifiants visibles dans le cadre. Dans des systèmes comme Gallio PRO, la rédaction automatique concerne les visages et les plaques d’immatriculation. D’autres éléments, tels que les logos, tatouages, badges nominatifs, documents ou l’image affichée sur un écran, peuvent nécessiter une rédaction manuelle dans l’éditeur.

Sur le plan technique, la rédaction vidéo assistée par l’IA repose généralement sur des modèles de détection d’objets et de suivi d’objets entre les images. Le deep learning est aujourd’hui le plus souvent utilisé lors de la construction du modèle d’IA, car il permet d’entraîner un réseau de neurones sur de grands ensembles d’images contenant des visages et des plaques d’immatriculation dans des conditions variées. Le modèle finalisé est ensuite utilisé pour flouter automatiquement les classes d’objets définies dans le fichier source.

Comment fonctionne la rédaction vidéo automatique par IA ?

Le processus de rédaction automatique est séquentiel et comprend plusieurs étapes. Leur bonne exécution a un impact direct sur l’efficacité de l’anonymisation ainsi que sur le risque de laisser une image non floutée.

Un pipeline de traitement typique se présente comme suit :

  1. décodage du fichier vidéo en flux d’images,
  2. détection des visages et des plaques d’immatriculation dans chaque image,
  3. suivi des objets dans le temps afin de maintenir la continuité du masque entre les images,
  4. interpolation de la position de l’objet si certaines images présentent une détection plus faible,
  5. application du masque de rédaction, le plus souvent sous forme de flou, de pixellisation ou d’occultation complète,
  6. rendu final et export du fichier.

En pratique, le détecteur seul ne suffit pas. Si le modèle détecte un visage sur 98 images sur 100, mais que l’objet disparaît du masque sur 2 images, il existe un risque de divulgation de données. C’est pourquoi les systèmes d’anonymisation vidéo combinent la détection avec le tracking et le contrôle de continuité. C’est la différence fondamentale entre un outil classique de computer vision et un outil de rédaction conforme aux exigences de confidentialité.

Technologies utilisées dans la rédaction vidéo assistée par l’IA

La rédaction vidéo automatique s’appuie sur des méthodes de vision par ordinateur et de machine learning. Dans les usages en production, les architectures CNN ainsi que les modèles hybrides et transformer plus récents dominent pour la détection d’objets. Le choix du modèle dépend du compromis entre précision, temps de traitement et exigences matérielles.

Les composants les plus courants sont :

  • la détection d’objets, par exemple des modèles à une étape ou à deux étapes pour localiser les visages et les plaques,
  • la segmentation ou les bounding boxes, selon que le masque doit suivre le contour exact ou couvrir une zone rectangulaire,
  • le suivi multi-objets, afin de conserver l’identification du même objet d’une image à l’autre,
  • le post-traitement, incluant le lissage des trajectoires, l’élargissement du masque et la réduction des faux positifs,
  • le rendu de la rédaction, avec application d’un flou, d’une pixellisation ou d’une occultation totale.

Dans les contenus de faible qualité, les conditions d’entrée sont particulièrement importantes : résolution, compression, flou de mouvement, angle de caméra et éclairage. Un modèle d’IA ne garantit pas la détection d’un objet trop petit, masqué ou hors focus. C’est pourquoi le système doit permettre une vérification manuelle après traitement.

Rédaction vidéo assistée par l’IA et rédaction manuelle

La rédaction automatique et la rédaction manuelle répondent au même besoin, mais diffèrent en matière d’échelle, de coût et de profil de risque. En environnement organisationnel, on utilise généralement un modèle hybride : automatisation pour les visages et les plaques, puis correction manuelle pour les cas particuliers.

Critère

Rédaction par IA

Rédaction manuelle

 

Vitesse de traitement

Élevée pour de grands volumes

Faible, dépendante de l’opérateur

Répétabilité

Élevée avec les mêmes paramètres

Variable

Gestion des exceptions

Limitée aux classes apprises par le modèle

Large

Risque d’omission

Dépend du recall du modèle et de la qualité du contenu

Dépend de la fatigue et de l’attention de l’opérateur

Scalabilité

Élevée

Faible

Gallio PRO ne réalise ni anonymisation en temps réel ni anonymisation de flux vidéo. Cette distinction technique est importante. Le traitement par fichier permet un contrôle qualité plus précis, une nouvelle vérification et une correction manuelle avant la publication ou le partage du contenu.

Paramètres clés et métriques de la rédaction vidéo assistée par l’IA

L’évaluation de l’efficacité d’un système ne doit pas reposer uniquement sur une déclaration de « haute précision ». Des indicateurs mesurables sont nécessaires. Dans le domaine de la rédaction vidéo, les métriques les plus importantes sont les métriques de détection et les métriques opérationnelles.

  • precision : proportion de détections correctes parmi l’ensemble des détections,
  • recall : proportion d’objets détectés parmi tous les objets réellement présents,
  • F1-score : moyenne harmonique de la precision et du recall,
  • false negative rate : proportion d’objets omis, critique du point de vue de la confidentialité,
  • IoU - Intersection over Union : mesure du recouvrement entre la zone détectée et la zone de référence,
  • latency ou throughput : temps de traitement du contenu ou débit du système,
  • frame coverage continuity : continuité du masque sur les images successives.

De façon simplifiée, le recall peut s’écrire selon la formule :

recall = TP / (TP + FN)

Pour l’anonymisation vidéo, un recall élevé est généralement plus important qu’une precision très élevée, car l’omission d’un visage ou d’une plaque d’immatriculation crée un risque direct de divulgation de données. En même temps, un masquage excessif réduit l’utilité du contenu ; le système doit donc trouver un équilibre.

Garanties d’efficacité et limites

La rédaction automatique à l’aide de l’IA ne fournit pas de garantie absolue de détection de chaque objet dans toutes les conditions. Une telle garantie serait techniquement invérifiable. En revanche, il est possible de définir des conditions d’efficacité, des procédures de validation et le périmètre fonctionnel du système.

Les limites suivantes doivent être prises en compte :

  • l’efficacité diminue en présence de petits objets, d’une forte compression et d’un faible éclairage,
  • l’occultation partielle d’un visage ou d’une plaque complique la détection,
  • un contenu avec des mouvements de caméra dynamiques augmente le risque d’erreurs inter-images,
  • le modèle ne détectera pas automatiquement des classes pour lesquelles il n’a pas été conçu.

C’est pourquoi les bonnes pratiques incluent des tests sur un échantillon de données propres à l’organisation, un contrôle qualité après rédaction et la possibilité de correction manuelle. Dans les systèmes on-premise, un autre avantage consiste à conserver les données au sein de sa propre infrastructure, ce qui limite l’exposition des contenus lors de transferts vers des services externes.

Rédaction vidéo assistée par l’IA dans le contexte du RGPD et de la protection de la vie privée

L’image d’une personne peut constituer une donnée à caractère personnel si elle permet une identification directe ou indirecte. Cette approche découle de l’article 4, point 1, du RGPD, c’est-à-dire du règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016. Le simple recours au floutage ne signifie pas toujours une anonymisation complète au sens du considérant 26 du RGPD. Tout dépend de la possibilité réelle d’identifier encore la personne.

S’agissant des visages, l’obligation de protection peut également découler des réglementations nationales relatives aux droits de la personnalité et à la diffusion de l’image, avec certaines exceptions concernant les personnes publiquement connues, les scènes publiques plus larges et les situations dans lesquelles la personne a reçu une rémunération convenue pour poser.

En ce qui concerne les plaques d’immatriculation, la situation juridique en Pologne n’est pas totalement uniforme. Une partie des lignes directrices des autorités de protection des données et de la pratique européenne va dans le sens de leur masquage, tandis que la jurisprudence nationale comporte aussi la position selon laquelle les plaques, à elles seules, ne constituent pas toujours une donnée à caractère personnel. Dans de nombreux pays européens, la pratique du masquage des plaques est plus stricte.

Références normatives et sources

Les actes et standards ci-dessous définissent le cadre d’interprétation applicable à la rédaction automatique d’images et de vidéos. Ils ne constituent pas la spécification d’un produit particulier, mais servent de base à l’évaluation de la conformité et du risque.

  • RGPD - Règlement (UE) 2016/679, article 4, point 1, article 5, article 25, considérant 26,
  • CEPD, Guidelines 4/2019 on Article 25 Data Protection by Design and by Default, version adoptée le 20 octobre 2020,
  • ISO/IEC 23894:2023 - Information technology - Artificial intelligence - Guidance on risk management,
  • ISO/IEC 27001:2022 - Information security management systems - Requirements,
  • NIST AI RMF 1.0, 2023 - Artificial Intelligence Risk Management Framework.