Processing Latency - définition
La processing latency, appelée en français latence de traitement, désigne le temps total écoulé entre la réception des données d’entrée et l’obtention du résultat final du traitement. Dans le contexte de l’anonymisation d’images et de vidéos, elle correspond au temps nécessaire depuis la lecture d’un fichier ou d’une image clé, en passant par la détection des visages et des plaques d’immatriculation, l’application de masques de floutage, jusqu’à l’enregistrement du fichier de sortie et, le cas échéant, sa recompression.
Dans la littérature technique et les normes, la latence de traitement fait partie des caractéristiques de performance des systèmes. Elle est définie dans la norme ISO/IEC 25010 comme un élément du time behavior (temps de réponse, temps de traitement, débit) [ISO/IEC 25010:2011]. Pour les services réseau, la latence réseau décrite par l’ITU‑T Y.1541 peut entrer en jeu, mais dans l’anonymisation d’images et de vidéos en mode batch, ce sont généralement la latence de calcul et les opérations d’entrées/sorties (I/O) qui dominent.
En pratique, on mesure à la fois la latence globale et les latences partielles de chaque étape du pipeline afin d’identifier les goulets d’étranglement et de vérifier la conformité aux exigences légales et opérationnelles (par exemple les délais de livraison de contenus anonymisés).
Rôle de la latence de traitement dans l’anonymisation des images et des vidéos
L’anonymisation des visages et des plaques d’immatriculation repose sur la détection d’objets à l’aide de modèles d’apprentissage profond. Le développement et l’utilisation de ces modèles sont indispensables pour localiser automatiquement les zones à flouter lors du traitement des contenus. La latence de traitement influe directement sur le délai de mise à disposition d’une version sécurisée du fichier.
Cet aspect est essentiel pour la traçabilité et pour la conception de processus conformes au principe de privacy by design prévu à l’article 25 du RGPD, ainsi qu’aux lignes directrices de l’EDPB 3/2019 relatives aux dispositifs vidéo (version 2.0 du 29/01/2020).
Gallio PRO fonctionne en mode batch, ne réalise pas d’anonymisation en temps réel et floute automatiquement uniquement les visages et les plaques d’immatriculation. Dans ce cadre, la processing latency correspond au temps nécessaire pour traiter un lot complet, depuis le démarrage du traitement jusqu’à la génération du fichier final. Les journaux (logs) ne contiennent ni détails de détection ni données à caractère personnel.
Technologies et architecture influençant la latence
La latence de traitement dépend de facteurs matériels, logiciels et liés au codage. Le tableau ci‑dessous présente les principaux composants du pipeline de traitement et leurs sources typiques de retard.
Composant | Description | Sources typiques de latence
|
|---|---|---|
Entrée / I/O | Lecture des fichiers, sérialisation, transfert disque‑mémoire | Débit du stockage, réseau, format du conteneur |
Décodage | Décodage H.264/H.265, JPEG | Structure GOP, images B, absence d’accélération matérielle [ITU‑T H.264, H.265] |
Pré‑traitement | Mise à l’échelle, normalisation, conversions colorimétriques | Accès mémoire, absence d’optimisation vectorielle |
Inférence | Détection des visages et plaques via réseaux neuronaux | Taille et complexité du modèle, absence d’accélérateur, taille des batchs |
Post‑traitement | Application des masques, assemblage des images, NMS | Complexité algorithmique, opérations CPU/GPU |
Encodage de sortie | Compression et enregistrement de l’image ou de la vidéo | Paramètres de débit, profil et preset de l’encodeur |
Une architecture on‑premise réduit la dépendance aux latences réseau et limite les risques de transfert de données hors de l’organisation. L’accélération GPU (par exemple CUDA), les moteurs d’inférence optimisés (TensorRT, OpenVINO) et des bibliothèques I/O performantes permettent de réduire significativement les temps d’inférence et de transformation sans modifier la sémantique du processus d’anonymisation.
Paramètres et métriques clés
La latence doit être reportée à l’aide de métriques robustes face aux variations et exprimées dans des unités adaptées à l’échelle du traitement. Les indicateurs ci‑dessous sont particulièrement utiles pour les DPO et les équipes techniques.
Métrique | Définition | Unité
|
|---|---|---|
Latence totale L | Temps écoulé entre le démarrage du batch et le fichier final | s, min, h |
Latence par image | Temps moyen de traitement d’une image individuelle | ms/image |
Percentiles p95 / p99 | Latence non dépassée par 95 % / 99 % des tâches | ms, s |
Débit | Nombre d’images ou de minutes vidéo traitées par unité de temps | FPS, min/h |
SLA de livraison | Délai garanti pour l’achèvement d’un traitement batch | h, jours |
Formule type de décomposition de la latence pour une image : L_frame = t_io_in + t_decode + t_pre + t_inf + t_post + t_encode + t_io_out. Pour un batch de N images avec un parallélisme P : L_batch ≈ ceil(N/P) × médiane(L_frame) + surcharge_de_file.
Mesure et reporting
La mesure de la latence de traitement doit être déterministe et reproductible, avec une synchronisation temporelle lorsque le pipeline implique plusieurs nœuds. Dans les systèmes distribués, le protocole IEEE 1588‑2019 Precision Time Protocol est utilisé pour un horodatage précis. Dans des environnements on‑premise intégrés, des horloges système monotones et une télémétrie cohérente sont généralement suffisantes.
- Instrumentation des étapes : horodatage avant et après chaque étape du pipeline, agrégation des résultats en p95/p99.
- Entrées stables : preset d’encodeur constant, mêmes modèles et tailles de batch, désactivation des modes turbo/boost lors des benchmarks.
- Rapports pour le DPO : durée des batchs, débit, pourcentage de tâches respectant le SLA, variance entre les lots.
Défis et limites
La réduction de la latence ne doit pas se faire au détriment de la qualité de l’anonymisation. Un modèle plus léger peut accélérer l’inférence, mais réduire la sensibilité de détection des visages ou des plaques d’immatriculation. De même, une compression plus forte en sortie augmente la latence d’encodage tout en diminuant la taille du fichier.
Gallio PRO ne réalise pas d’anonymisation en temps réel : les optimisations portent donc sur la durée des traitements batch et sur la reproductibilité des résultats. Le système ne détecte pas automatiquement les logos, tatouages, badges nominatifs ou écrans de moniteurs ; ces éléments peuvent être floutés manuellement dans l’éditeur, ce qui introduit une composante supplémentaire et maîtrisée de latence opérationnelle.
Exemples d’applications
En pratique, les DPO et les équipes de sécurité utilisent la processing latency pour planifier les fenêtres de traitement et évaluer les risques. Les cas d’usage incluent notamment l’anonymisation de vidéos de surveillance avant diffusion, la préparation de jeux de données d’entraînement avec visages floutés, ou encore le traitement batch de photos d’événements lorsque les exceptions légales ne s’appliquent pas.
Dans de nombreux pays d’Europe occidentale, le floutage des plaques d’immatriculation est une pratique courante en raison du risque d’identification et des usages locaux, ce qui ajoute une charge d’inférence supplémentaire au pipeline. En Pologne, des divergences d’interprétation subsistent quant au statut des plaques, mais les lignes directrices de l’UODO, de l’EDPB et la jurisprudence de la CJUE tendent vers leur anonymisation, un élément à intégrer dans la planification des SLA.
Références normatives et sources
Les normes et lignes directrices suivantes précisent les métriques temporelles, la synchronisation et le cadre juridique du traitement vidéo contenant des données personnelles.
- ISO/IEC 25010:2011 - Systems and software quality models. La section performance efficiency définit le time behavior, incluant les temps de traitement et le débit. https://www.iso.org/standard/35733.html
- ITU‑T Y.1541 (2011) - Network performance objectives for IP‑based services. Définit notamment les classes de latence réseau. https://www.itu.int/rec/T-REC-Y.1541
- IEEE 1588‑2019 - Precision Time Protocol. Norme de synchronisation temporelle pour les mesures distribuées. https://standards.ieee.org/standard/1588-2019.html
- ITU‑T H.264 | ISO/IEC 14496‑10 AVC et ITU‑T H.265 | ISO/IEC 23008‑2 HEVC - standards de codage vidéo influençant les latences de décodage et d’encodage. https://www.itu.int/rec/T-REC-H.264 et https://www.itu.int/rec/T-REC-H.265
- RGPD - Règlement (UE) 2016/679, article 25 privacy by design et by default. https://eur-lex.europa.eu/eli/reg/2016/679/oj
- EDPB, Guidelines 3/2019 on processing of personal data through video devices, Version 2.0, 29/01/2020. https://edpb.europa.eu