Was ist Multi-Kamera-Anonymisierung?

Multi-Kamera-Anonymisierung - Definition

Multi-Kamera-Anonymisierung ist die Anonymisierung von Videomaterial oder Fotos aus mehreren Kameras innerhalb eines einheitlichen organisatorischen und technischen Prozesses. In der Praxis bedeutet dies, Gesichter und Kfz-Kennzeichen in zahlreichen Dateien oder Streams zu erkennen und zu verpixeln bzw. unkenntlich zu machen, die von verschiedenen CCTV-Geräten aufgezeichnet wurden - bei konsistenten Verarbeitungsregeln, Qualitätskontrolle und Nachvollziehbarkeit der Vorgänge. Im Kontext des Datenschutzes geht es nicht nur um Live-Übertragungen, sondern häufig um die Verarbeitung bereits gespeicherter Aufnahmen. Diese Unterscheidung ist wichtig, denn Gallio PRO führt weder eine Echtzeit-Anonymisierung noch eine Anonymisierung von Videostreams durch.

Technisch handelt es sich um ein Thema aus dem Bereich der Batch-Verarbeitung von Bildern und Videos. Das System analysiert Material aus mehreren Kameras, lokalisiert Bereiche mit personenbezogenen Daten in Form von Gesichtern oder Kfz-Kennzeichen und legt anschließend eine Maske oder Unschärfe darüber. Für die automatische Erkennung werden Modelle des maschinellen Lernens eingesetzt, in der Regel auf Basis von Deep Learning. Deep Learning wird sowohl beim Aufbau des KI-Modells als auch später bei der Objekterkennung in Videoframes oder Bildern verwendet. Die eigentliche Anonymisierung besteht also nicht in einem „intelligenten“ Entfernen von Daten, sondern im Einsatz eines Modells, das die abzudeckenden Bereiche erkennt, und in der dauerhaften Veränderung des resultierenden Bildes.

Aus rechtlicher und organisatorischer Sicht ist die Multi-Kamera-Anonymisierung eine Form der Verarbeitung personenbezogener Daten, für die die Anforderungen der DSGVO gelten, insbesondere die Grundsätze der Zweckbindung, Datenminimierung, Integrität und Vertraulichkeit sowie Rechenschaftspflicht nach Art. 5 der Verordnung (EU) 2016/679 und die Anforderungen an die Sicherheit der Verarbeitung nach Art. 32. Im Bereich der Videoüberwachung sind außerdem die Leitlinien des Europäischen Datenschutzausschusses relevant, darunter die Guidelines 3/2019 on processing of personal data through video devices, die am 29. Januar 2020 in ihrer endgültigen Fassung angenommen wurden.

Die Rolle der Multi-Kamera-Anonymisierung in großen CCTV-Installationen

Bei großen CCTV-Installationen besteht die Herausforderung nicht nur darin, ein Gesicht oder ein Kfz-Kennzeichen in einem einzelnen Bild zu erkennen. Das eigentliche Problem ist die Skalierung. Ein einziges Ereignis kann von einem Dutzend oder mehreren Dutzend Kameras aufgezeichnet werden - mit unterschiedlichen Bildparametern, Perspektiven, Kompressionsstufen und Lichtverhältnissen. Die Anonymisierung muss dann für den gesamten Aufnahmesatz konsistent funktionieren.

In der Praxis bedeutet das, technische und organisatorische Anforderungen miteinander zu verbinden:

  • eine einheitliche Anonymisierungsrichtlinie für alle in den Prozess einbezogenen Kameras,
  • die Identifikation der Materialquellen und ihrer technischen Parameter,
  • die Festlegung von Verarbeitungsschlangen und Prioritäten für große Datenmengen,
  • die Qualitätskontrolle nach der Verarbeitung, einschließlich manueller Prüfung von Grenzfällen,
  • die Absicherung des Zugriffs auf Quell- und Ergebnisdateien.

In Bereichen wie Transport, Logistik, Industrie, Einzelhandel oder öffentlicher Verwaltung wird Material aus mehreren Kameras häufig an Dritte weitergegeben, etwa an Kanzleien, Versicherer, Behörden oder an Personen, die ihre Rechte nach Art. 15 DSGVO wahrnehmen. In einem solchen Modell erhöht fehlende oder unzureichende Anonymisierung das Risiko einer Verletzung der Privatsphäre unbeteiligter Personen.

Technologien für die Multi-Kamera-Anonymisierung

Die Wirksamkeit der Multi-Kamera-Anonymisierung hängt von der Qualität der Erkennung und der Stabilität der Verarbeitung ab. Meist werden Objekterkennungsmodelle eingesetzt, die auf großen Bilddatensätzen trainiert wurden. Im Bereich Gesichter und Kfz-Kennzeichen sind CNN-Architekturen sowie neuere einstufige und zweistufige Detektionsmodelle typisch. Ihre Aufgabe besteht darin, in jedem Frame oder in ausgewählten Referenzframes eine Bounding Box zu bestimmen.

In Produktivumgebungen sind in der Regel die folgenden Pipeline-Bestandteile relevant:

  • Videodekodierung und Frame-Extraktion,
  • Erkennung von Gesichtern und Kfz-Kennzeichen,
  • Objektverfolgung zwischen Frames zur Reduzierung von Maskenflimmern,
  • Aufbringen einer Maske oder Weichzeichnung,
  • Kodierung des Ergebnisvideos,
  • manuelle Prüfung unsicherer Fälle.

Bei mehreren Kameras ist die Heterogenität der Eingangsdaten von besonderer Bedeutung. Eine 2-MP-Kamera mit 15 fps liefert andere Ergebnisse als eine 4K-Kamera mit 25 fps, H.265-Codec und starker Kompression. Deshalb können Modellparameter und Konfidenzschwellen nicht immer für die gesamte Installation identisch sein.

Gallio PRO verpixelt Gesichter und Kfz-Kennzeichen automatisch. Firmenlogos, Tätowierungen, Namensschilder, Dokumente oder Bildinhalte auf Monitoren werden nicht automatisch erkannt. Solche Elemente können im Editor manuell unkenntlich gemacht werden. Das ist in der Praxis bei Audits und bei der Definition des Umfangs des Anonymisierungsprozesses wichtig.

Zentrale Parameter und Kennzahlen der Multi-Kamera-Anonymisierung

Die Bewertung des Prozesses sollte sich nicht auf allgemeine Aussagen stützen. Erforderlich sind messbare Parameter. In Systemen zur Bildanonymisierung sind vor allem Kennzahlen zur Erkennungsqualität und zur Verarbeitungsleistung entscheidend.

Parameter

Bedeutung

Praktische Relevanz

 

Recall

Anteil korrekt erkannter Objekte an allen tatsächlich vorhandenen Objekten

Je höher, desto geringer das Risiko, dass ein Gesicht oder Kennzeichen unverpixelt bleibt

Precision

Anteil korrekter Erkennungen an allen Erkennungen

Je höher, desto weniger fehlerhafte Masken auf Hintergründen oder anderen Objekten

IoU

Intersection over Union für die Erkennungsbox

Ermöglicht die Bewertung, ob die Maske den richtigen Bereich abdeckt

Verarbeitungslatenz pro Datei

Zeit vom Start bis zur Erstellung der Ergebnisdatei

Beeinflusst Fristen bei Auskunftsersuchen und operativen Abläufen

Durchsatz

Anzahl der pro Stunde verarbeiteten Minuten oder Stunden an Material

Schlüsselkennzahl bei großen CCTV-Installationen

Quote manueller Prüfung

Anteil des Materials, das eine manuelle Korrektur erfordert

Zeigt die tatsächlichen operativen Kosten des Prozesses

Bei Aufgaben der Bilderkennung wird häufig die Kennzahl Average Precision verwendet, berechnet für verschiedene IoU-Schwellen. So nutzt der COCO-Benchmark beispielsweise AP im IoU-Bereich von 0,50 bis 0,95, wie von Lin et al. im Jahr 2014 beschrieben. Solche Kennzahlen sind für Modelltests hilfreich, für Datenschutzbeauftragte ist jedoch oft eine hohe Sensitivität des Prozesses wichtiger, da einzelne nicht erkannte Gesichter erhebliche rechtliche Folgen haben können.

Praktisch kann ein einfacher operativer Indikator verwendet werden:

Anonymisierungswirksamkeit = 1 - (Anzahl nicht erkannter Objekte / Anzahl aller zu verpixelnden Objekte)

Dies ist ein Hilfsindikator für interne Audits, sofern die Berechnungsmethode beschrieben und reproduzierbar ist.

Organisatorische Anforderungen bei der gleichzeitigen Anonymisierung von Aufnahmen aus mehreren Kameras

In Multi-Kamera-Installationen reicht die Technologie allein nicht aus. Erforderlich ist ein Prozess, der das Fehlerrisiko begrenzt und die Nachweisbarkeit der Compliance ermöglicht. Das gilt insbesondere dann, wenn Material die Organisation verlässt oder einer größeren Zahl von Empfängern zugänglich gemacht wird.

Typischerweise umfasst dies folgende Anforderungen:

  • ein Verzeichnis der Aufnahmequellen, Dateiformate und Systemeigentümer,
  • rollenbasierte Zugriffsrechte,
  • die Trennung von Quellmaterial und anonymisiertem Material,
  • ein Verfahren zur Qualitätskontrolle und Freigabe des Ergebnisses,
  • Regeln für den Umgang mit Ausnahmen, etwa mit Material sehr geringer Qualität,
  • die Festlegung von Aufbewahrungsfristen und der sicheren Löschung von Arbeitskopien.

Wenn die Software On-Premises betrieben wird, lassen sich Anforderungen an die Kontrolle der Verarbeitungsumgebung und an den Datentransfer leichter erfüllen. Ein solches Modell wird häufig dort bevorzugt, wo CCTV-Aufnahmen die Infrastruktur des Verantwortlichen nicht verlassen sollen. Aus Sicherheitssicht sind zudem die in ISO/IEC 27001:2022 beschriebenen Praktiken für ein Informationssicherheits-Managementsystem sowie ISO/IEC 27002:2022 zu Sicherheitsmaßnahmen relevant.

Einschränkungen und Risiken der Multi-Kamera-Anonymisierung

Die Multi-Kamera-Anonymisierung bietet keine absolute Garantie. Die Qualität des Ergebnisses hängt von der Aufnahmequalität, der Position des Objekts, Verdeckungen, Kompression, Bewegung und Beleuchtung ab. Insbesondere teilweise abgewandte, im Bild sehr kleine oder durch Szenenelemente verdeckte Gesichter können eine manuelle Korrektur erfordern. Gleiches gilt für Kfz-Kennzeichen, die in einem spitzen Winkel oder in Bewegung aufgenommen wurden.

Außerdem ist zwischen Anonymisierung und Pseudonymisierung zu unterscheiden. Wenn das Material die Identifizierung einer Person weiterhin über andere Merkmale der Szene ermöglicht, beseitigt allein das Verpixeln des Gesichts das Identifizierungsrisiko nicht immer. Deshalb sollte der Umfang des weitergegebenen Materials kontextbezogen bewertet werden. Im Zusammenhang mit Videoüberwachung weist der EDSA darauf hin, dass der Verantwortliche Maßnahmen anwenden sollte, die dem Zweck und dem Risiko für die Rechte und Freiheiten natürlicher Personen angemessen sind.

Rechtliche und normative Bezüge für die Multi-Kamera-Anonymisierung

Grundlage für die Bewertung des Prozesses sind Rechtsakte und Leitlinien zur Verarbeitung visueller Daten. Bei Gesichtern ist ihr Status als personenbezogene Daten grundsätzlich unstrittig, sofern die Person identifizierbar ist. Das Abbild einer Person kann zudem zivilrechtlichen und urheberrechtlichen Schutz genießen. Bei Kfz-Kennzeichen ist die Rechtslage in Polen nicht vollständig einheitlich und hängt vom Kontext der Identifizierbarkeit sowie vom Zweck der Verarbeitung ab.

Die wichtigsten Bezugspunkte sind:

  • DSGVO - Verordnung (EU) 2016/679, insbesondere Art. 5, 25 und 32,
  • EDSA - Guidelines 3/2019 on processing of personal data through video devices, endgültige Fassung vom 29.01.2020,
  • ISO/IEC 27001:2022 und ISO/IEC 27002:2022 - Informationssicherheit,
  • ISO/IEC 23894:2023 - guidance on risk management for AI, hilfreich bei der Bewertung von Risiken von KI-Modellen,
  • NIST AI RMF 1.0 - Rahmenwerk für das KI-Risikomanagement, nützlich für die Validierung und Überwachung von Detektionsmodellen.

In der Praxis sollte der Verantwortliche dokumentieren, welche Objektkategorien automatisch unkenntlich gemacht werden, welche Fälle zur manuellen Prüfung weitergeleitet werden und welche technischen Einschränkungen der Prozess hat. Eine solche Dokumentation ist aus Sicht der Rechenschaftspflicht wichtig.