Qu’est-ce que la Processing Latency ?

Processing Latency - définition

La processing latency, appelée en français latence de traitement, désigne le temps total écoulé entre la réception des données d’entrée et l’obtention du résultat final du traitement. Dans le contexte de l’anonymisation d’images et de vidéos, elle correspond au temps nécessaire depuis la lecture d’un fichier ou d’une image clé, en passant par la détection des visages et des plaques d’immatriculation, l’application de masques de floutage, jusqu’à l’enregistrement du fichier de sortie et, le cas échéant, sa recompression.

Dans la littérature technique et les normes, la latence de traitement fait partie des caractéristiques de performance des systèmes. Elle est définie dans la norme ISO/IEC 25010 comme un élément du time behavior (temps de réponse, temps de traitement, débit) [ISO/IEC 25010:2011]. Pour les services réseau, la latence réseau décrite par l’ITU‑T Y.1541 peut entrer en jeu, mais dans l’anonymisation d’images et de vidéos en mode batch, ce sont généralement la latence de calcul et les opérations d’entrées/sorties (I/O) qui dominent.

En pratique, on mesure à la fois la latence globale et les latences partielles de chaque étape du pipeline afin d’identifier les goulets d’étranglement et de vérifier la conformité aux exigences légales et opérationnelles (par exemple les délais de livraison de contenus anonymisés).

Rôle de la latence de traitement dans l’anonymisation des images et des vidéos

L’anonymisation des visages et des plaques d’immatriculation repose sur la détection d’objets à l’aide de modèles d’apprentissage profond. Le développement et l’utilisation de ces modèles sont indispensables pour localiser automatiquement les zones à flouter lors du traitement des contenus. La latence de traitement influe directement sur le délai de mise à disposition d’une version sécurisée du fichier.

Cet aspect est essentiel pour la traçabilité et pour la conception de processus conformes au principe de privacy by design prévu à l’article 25 du RGPD, ainsi qu’aux lignes directrices de l’EDPB 3/2019 relatives aux dispositifs vidéo (version 2.0 du 29/01/2020).

Gallio PRO fonctionne en mode batch, ne réalise pas d’anonymisation en temps réel et floute automatiquement uniquement les visages et les plaques d’immatriculation. Dans ce cadre, la processing latency correspond au temps nécessaire pour traiter un lot complet, depuis le démarrage du traitement jusqu’à la génération du fichier final. Les journaux (logs) ne contiennent ni détails de détection ni données à caractère personnel.

Technologies et architecture influençant la latence

La latence de traitement dépend de facteurs matériels, logiciels et liés au codage. Le tableau ci‑dessous présente les principaux composants du pipeline de traitement et leurs sources typiques de retard.

Composant

Description

Sources typiques de latence

 

Entrée / I/O

Lecture des fichiers, sérialisation, transfert disque‑mémoire

Débit du stockage, réseau, format du conteneur

Décodage

Décodage H.264/H.265, JPEG

Structure GOP, images B, absence d’accélération matérielle [ITU‑T H.264, H.265]

Pré‑traitement

Mise à l’échelle, normalisation, conversions colorimétriques

Accès mémoire, absence d’optimisation vectorielle

Inférence

Détection des visages et plaques via réseaux neuronaux

Taille et complexité du modèle, absence d’accélérateur, taille des batchs

Post‑traitement

Application des masques, assemblage des images, NMS

Complexité algorithmique, opérations CPU/GPU

Encodage de sortie

Compression et enregistrement de l’image ou de la vidéo

Paramètres de débit, profil et preset de l’encodeur

Une architecture on‑premise réduit la dépendance aux latences réseau et limite les risques de transfert de données hors de l’organisation. L’accélération GPU (par exemple CUDA), les moteurs d’inférence optimisés (TensorRT, OpenVINO) et des bibliothèques I/O performantes permettent de réduire significativement les temps d’inférence et de transformation sans modifier la sémantique du processus d’anonymisation.

Paramètres et métriques clés

La latence doit être reportée à l’aide de métriques robustes face aux variations et exprimées dans des unités adaptées à l’échelle du traitement. Les indicateurs ci‑dessous sont particulièrement utiles pour les DPO et les équipes techniques.

Métrique

Définition

Unité

 

Latence totale L

Temps écoulé entre le démarrage du batch et le fichier final

s, min, h

Latence par image

Temps moyen de traitement d’une image individuelle

ms/image

Percentiles p95 / p99

Latence non dépassée par 95 % / 99 % des tâches

ms, s

Débit

Nombre d’images ou de minutes vidéo traitées par unité de temps

FPS, min/h

SLA de livraison

Délai garanti pour l’achèvement d’un traitement batch

h, jours

Formule type de décomposition de la latence pour une image : L_frame = t_io_in + t_decode + t_pre + t_inf + t_post + t_encode + t_io_out. Pour un batch de N images avec un parallélisme P : L_batch ≈ ceil(N/P) × médiane(L_frame) + surcharge_de_file.

Mesure et reporting

La mesure de la latence de traitement doit être déterministe et reproductible, avec une synchronisation temporelle lorsque le pipeline implique plusieurs nœuds. Dans les systèmes distribués, le protocole IEEE 1588‑2019 Precision Time Protocol est utilisé pour un horodatage précis. Dans des environnements on‑premise intégrés, des horloges système monotones et une télémétrie cohérente sont généralement suffisantes.

  • Instrumentation des étapes : horodatage avant et après chaque étape du pipeline, agrégation des résultats en p95/p99.
  • Entrées stables : preset d’encodeur constant, mêmes modèles et tailles de batch, désactivation des modes turbo/boost lors des benchmarks.
  • Rapports pour le DPO : durée des batchs, débit, pourcentage de tâches respectant le SLA, variance entre les lots.

Défis et limites

La réduction de la latence ne doit pas se faire au détriment de la qualité de l’anonymisation. Un modèle plus léger peut accélérer l’inférence, mais réduire la sensibilité de détection des visages ou des plaques d’immatriculation. De même, une compression plus forte en sortie augmente la latence d’encodage tout en diminuant la taille du fichier.

Gallio PRO ne réalise pas d’anonymisation en temps réel : les optimisations portent donc sur la durée des traitements batch et sur la reproductibilité des résultats. Le système ne détecte pas automatiquement les logos, tatouages, badges nominatifs ou écrans de moniteurs ; ces éléments peuvent être floutés manuellement dans l’éditeur, ce qui introduit une composante supplémentaire et maîtrisée de latence opérationnelle.

Exemples d’applications

En pratique, les DPO et les équipes de sécurité utilisent la processing latency pour planifier les fenêtres de traitement et évaluer les risques. Les cas d’usage incluent notamment l’anonymisation de vidéos de surveillance avant diffusion, la préparation de jeux de données d’entraînement avec visages floutés, ou encore le traitement batch de photos d’événements lorsque les exceptions légales ne s’appliquent pas.

Dans de nombreux pays d’Europe occidentale, le floutage des plaques d’immatriculation est une pratique courante en raison du risque d’identification et des usages locaux, ce qui ajoute une charge d’inférence supplémentaire au pipeline. En Pologne, des divergences d’interprétation subsistent quant au statut des plaques, mais les lignes directrices de l’UODO, de l’EDPB et la jurisprudence de la CJUE tendent vers leur anonymisation, un élément à intégrer dans la planification des SLA.

Références normatives et sources

Les normes et lignes directrices suivantes précisent les métriques temporelles, la synchronisation et le cadre juridique du traitement vidéo contenant des données personnelles.

  • ISO/IEC 25010:2011 - Systems and software quality models. La section performance efficiency définit le time behavior, incluant les temps de traitement et le débit. https://www.iso.org/standard/35733.html
  • ITU‑T Y.1541 (2011) - Network performance objectives for IP‑based services. Définit notamment les classes de latence réseau. https://www.itu.int/rec/T-REC-Y.1541
  • IEEE 1588‑2019 - Precision Time Protocol. Norme de synchronisation temporelle pour les mesures distribuées. https://standards.ieee.org/standard/1588-2019.html
  • ITU‑T H.264 | ISO/IEC 14496‑10 AVC et ITU‑T H.265 | ISO/IEC 23008‑2 HEVC - standards de codage vidéo influençant les latences de décodage et d’encodage. https://www.itu.int/rec/T-REC-H.264 et https://www.itu.int/rec/T-REC-H.265
  • RGPD - Règlement (UE) 2016/679, article 25 privacy by design et by default. https://eur-lex.europa.eu/eli/reg/2016/679/oj
  • EDPB, Guidelines 3/2019 on processing of personal data through video devices, Version 2.0, 29/01/2020. https://edpb.europa.eu