Was ist Batch-Videoverarbeitung?

Inhaltsverzeichnis

Batch-Videoverarbeitung - Definition
Die Rolle der Batch-Videoverarbeitung bei der Anonymisierung großer Videoarchive
Wie eine Pipeline für die Batch-Anonymisierung organisiert werden sollte
Technologien in der Batch-Videoverarbeitung
Wichtige Parameter und Kennzahlen der Batch-Videoverarbeitung
Herausforderungen und Grenzen der Batch-Videoverarbeitung
Normative Bezüge und Quellen zur Batch-Videoverarbeitung

Batch-Videoverarbeitung - Definition

Batch-Videoverarbeitung, also die stapelweise Verarbeitung von Videodateien, ist eine Form der Systemorganisation, bei der viele Aufnahmen automatisch als Aufgabensatz verarbeitet werden - nicht einzeln und nicht im Streaming- oder Echtzeitmodus. Im Kontext der Anonymisierung von Bildern und Videos bedeutet dies, eine Abfolge von Verarbeitungsschritten auf große Dateivolumen, meist Archivbestände, nach einer vorab definierten Pipeline anzuwenden. Jede Datei durchläuft dieselben Phasen: Ingest, Formatvalidierung, Dekodierung, Frame-Extraktion oder Bild-für-Bild-Analyse, Erkennung schutzbedürftiger Objekte, Objekt-Tracking über die Zeit, Aufbringen einer Maske oder Unschärfe, Re-Encoding, Qualitätskontrolle und Speicherung des Ergebnisses.

In der technischen Praxis steht Batch Processing dem Real-Time Processing gegenüber. Das System muss keine Anforderungen an geringe Latenz erfüllen, wohl aber eine vorhersehbare Verarbeitungskapazität, Fehlertoleranz und die Möglichkeit zur Wiederaufnahme von Jobs sicherstellen. Bei der Videoanonymisierung geht es meist um die automatische Erkennung und Unkenntlichmachung von Gesichtern und Kfz-Kennzeichen in großen Mengen von Videomaterial. Dieser Ansatz ist Standard in Videoüberwachungsarchiven, Beweismitteln, Audit-Beständen, Medienarchiven und Veröffentlichungsprozessen für zuvor anonymisierte Inhalte.

In Systemen wie Gallio PRO bezieht sich die Batch-Videoverarbeitung auf Dateien, die auf Festplatten oder in Repositorien gespeichert sind. Sie bedeutet weder die Anonymisierung eines Videostreams noch eine Verarbeitung in Echtzeit. Die automatische Erkennung umfasst Gesichter und Kfz-Kennzeichen. Andere Elemente wie Dokumente, Monitorinhalte, Tätowierungen, Logos oder Namensschilder können manuelle Bearbeitung im Editor erfordern, wenn das System dafür keine automatische Erkennung bietet.

Die Rolle der Batch-Videoverarbeitung bei der Anonymisierung großer Videoarchive

Bei Projekten zur Anonymisierung von Archiven besteht die größte Herausforderung nicht darin, ein einzelnes Gesicht unscharf zu machen, sondern darin, tausende Stunden Material reproduzierbar zu verarbeiten - mit Qualitätskontrolle und vollständiger Nachvollziehbarkeit des Prozesses. Batch-Videoverarbeitung löst dieses Problem, indem die Arbeit in getrennte Phasen aufgeteilt und die Ausführung automatisiert wird.

Für Datenschutzbeauftragte ist besonders wichtig, dass eine Batch-Pipeline einheitliche Verarbeitungsregeln für den gesamten Datenbestand ermöglicht. Dadurch wird das Risiko reduziert, einzelne Dateien versehentlich auszulassen oder in vergleichbaren Fällen unterschiedliche Anonymisierungseinstellungen anzuwenden.

Skalierbarkeit - das System kann tausende Dateien über eine Job-Warteschlange und mehrere Worker verarbeiten.
Reproduzierbarkeit - dasselbe Erkennungsmodell, dieselben Schwellenwerte und dieselben Maskierungsrichtlinien für den gesamten Batch.
Robustheit - eine fehlerhafte Datei stoppt nicht den gesamten Prozess, und der Job kann erneut ausgeführt werden.
Auditierbarkeit - Ergebnisse lassen sich einer Modellversion, Parametern und dem Ausführungszeitpunkt zuordnen.
Trennung der Umgebungen - On-Premise-Verarbeitung ohne Übermittlung der Aufnahmen an öffentliche Dienste lässt sich einfacher aufrechterhalten.

Wie eine Pipeline für die Batch-Anonymisierung organisiert werden sollte

Die Pipeline sollte als Abfolge von Phasen konzipiert sein, die sich überwachen und neu starten lassen. In der Praxis bewährt sich am besten eine Queue-basierte Architektur mit unabhängigen CPU- und GPU-Workern. Dekodierung, Modellinferenz und abschließendes Encoding haben unterschiedliche Lastprofile und sollten daher nicht in einem einzigen, nicht weiter differenzierten Prozess zusammengefasst werden.

Bei großen Archiven ist es sinnvoll, nicht nur die Ergebnisdatei zu speichern, sondern auch technische Metadaten, die für die Nachvollziehbarkeit des Prozesses erforderlich sind. Es sollten jedoch keine Logs erzeugt werden, die personenbezogene Daten oder Detektions-Snapshots enthalten. Gallio PRO sollte keine Logs erfassen, die Gesichts- oder Kennzeichenerkennungen enthalten, ebenso wenig andere Protokolle mit personenbezogenen Daten.

Phase	Technische Beschreibung	Ziel
Ingest	Dateiimport, Prüfsumme, Identifikation von Codec und Container	Überprüfung von Vollständigkeit und Konformität des Inputs
Dekodierung	Auslesen des Videostreams in Frames oder GOP-Segmente	Vorbereitung der Daten für die Analyse
Detektion	Ein Deep-Learning-Modell erkennt Gesichter und Kfz-Kennzeichen	Festlegung der zu anonymisierenden Bereiche
Tracking	Verknüpfung von Detektionen über mehrere Frames hinweg	Stabile Maskierung über die Zeit
Maskierung	Blur, Pixelation oder vollständige Abdeckung des Bereichs	Reduzierung der Identifizierbarkeit
Re-Encoding	Erneute Kodierung des Ergebnisvideos	Erzeugung einer einsatzbereiten Datei
QA	Automatisierte Kontrolle und manuelle Stichprobe	Bewertung von Wirksamkeit und Fehlern

Technologien in der Batch-Videoverarbeitung

Die automatische Anonymisierung von Gesichtern und Kfz-Kennzeichen basiert in der Regel auf Deep-Learning-Modellen. Deep Learning wird genutzt, um ein KI-Modell zu erstellen, das anschließend die Objekterkennung auf einzelnen Videoframes ausführt. In der Praxis kommen CNN-Erkennungsarchitekturen oder neuere Alternativen zum Einsatz, die auf annotierten Datensätzen trainiert werden. Das Modell allein reicht jedoch nicht aus. Für einen zuverlässigen Betrieb sind außerdem Algorithmen zur Objektverfolgung, Mechanismen zur Interpolation fehlender Detektionen und eine Qualitätskontrolle der Maskierung erforderlich.

Auf Infrastrukturseite umfasst der typische Technologie-Stack GPU-Beschleunigung für die Inferenz, Job-Warteschlangen, Dateispeicher, eine Datenbank für technische Metadaten und ein Orchestrierungsmodul. Für Umgebungen mit erhöhten Sicherheitsanforderungen wird eine On-Premise-Bereitstellung bevorzugt.

Wichtige Parameter und Kennzahlen der Batch-Videoverarbeitung

Die Bewertung einer Batch-Pipeline darf sich nicht ausschließlich auf die Ausführungszeit stützen. Bei der Anonymisierung zählen sowohl die Erkennungsleistung als auch die Betriebsstabilität und die Kosten für die Verarbeitung einer Stunde Videomaterial. Die Parameter sollten getrennt für Gesichter und für Kfz-Kennzeichen gemessen werden, da sich Objektgröße, Lichtbedingungen und Fehlerdynamik unterscheiden.

Durchsatz - Anzahl der Minuten oder Stunden Material, die pro Systemstunde verarbeitet werden.
Job-Latenz - Zeit vom Einstellen einer Datei in die Warteschlange bis zum Ergebnis.
Recall - Anteil der tatsächlich vorhandenen Gesichter oder Kennzeichen, die vom System erkannt wurden.
Precision - Anteil korrekter Detektionen an allen Detektionen des Systems.
Frame Miss Rate - Anteil der Frames, in denen ein vorhandenes Objekt nicht unkenntlich gemacht wurde.
Tracking Continuity - Konsistenz der Maskierung über aufeinanderfolgende Frames.
Failure Rate - Anteil der Dateien, deren Verarbeitung mit einem technischen Fehler endet.
Output-Bitrate - Zielbitrate nach dem Re-Encoding, die Qualität und Dateigröße beeinflusst.

Vereinfacht lässt sich der Durchsatz wie folgt ausdrücken: Throughput = Gesamtdauer des Eingangsmaterials / gesamte Verarbeitungszeit. Für die Ressourcenplanung ist auch die Kennzahl GPU-Stunden / 100 Stunden Material hilfreich.

Herausforderungen und Grenzen der Batch-Videoverarbeitung

Archivmaterial weist oft große Qualitätsunterschiede auf. Alte Codecs, niedrige Bitraten, Interlacing, SD-Auflösung, Nachtaufnahmen und starke Kompression verschlechtern die Qualität der Detektion. Dasselbe gilt für Aufnahmen mit starker Kamerabewegung, Verdeckungen und kleinen Objekten im Hintergrund. Unter solchen Bedingungen sind konservative Schwellenwerte und manuelle Stichprobenkontrollen erforderlich.

In der Praxis müssen zudem technische und rechtliche Aspekte getrennt betrachtet werden. Ein Gesicht kann in visuellem Material ein personenbezogenes Datum darstellen, wenn es die Identifizierung einer Person ermöglicht. Die Pflicht zur Anonymisierung ergibt sich aus dem Verarbeitungskontext, unter anderem aus der DSGVO, dem Schutz von Persönlichkeitsrechten und den Regeln zur Verbreitung von Bildnissen. Bei Kfz-Kennzeichen wird die Rechtslage in Polen teilweise unterschiedlich bewertet. Es gibt Positionen, die eine Unkenntlichmachung befürworten, zugleich aber auch eine Rechtsprechungslinie der Verwaltungsgerichte, nach der Kennzeichen allein nicht immer personenbezogene Daten darstellen. In vielen westeuropäischen Ländern ist die Schutzpraxis in der Regel strenger.

Normative Bezüge und Quellen zur Batch-Videoverarbeitung

Batch-Videoverarbeitung ist als technischer Begriff nicht in einer einzelnen Branchennorm für die Videoanonymisierung definiert. Seine Bedeutung ergibt sich aus dem etablierten Gebrauch in der Informatik des Batch Processing und aus der Praxis von Computer-Vision-Systemen. Für die Bewertung von Konformität und Sicherheit sollte auf Rechtsakte und Normen Bezug genommen werden, die Datenverarbeitung, Sicherheitsmanagement und die Bewertung von KI-Systemen beschreiben.

Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates - DSGVO, 2016.
ISO/IEC 27001:2022 - Anforderungen an ein Informationssicherheits-Managementsystem, ISO/IEC, 2022.
ISO/IEC 23894:2023 - Risikomanagement für künstliche Intelligenz, ISO/IEC, 2023.
NIST AI RMF 1.0 - Artificial Intelligence Risk Management Framework, NIST, 2023.
ISO/IEC 22989:2022 - Begriffe und Terminologie der KI, ISO/IEC, 2022.
ETSI EN 303 645 V2.1.1, 2020 - bewährte Sicherheitspraktiken für vernetzte Geräte, relevant bei der Arbeit mit Material aus IoT-Kameras.

Wenn eine Organisation eine On-Premise-Pipeline implementiert, sollte sie zusätzlich Folgendes dokumentieren: die Version des Erkennungsmodells, den Umfang des Eingangsdatenbestands, den Stichprobenumfang der Qualitätskontrolle, das Verfahren zur Fehlerbehandlung sowie die Regeln zur Aufbewahrung von Quell- und Ergebnisdateien.

Siehe auch

Zurück zum Glossar