Artificial Intelligence in der Anonymisierung - Definition
Artificial Intelligence in der Anonymisierung bezeichnet den Einsatz von Methoden der künstlichen Intelligenz zur Erkennung und Unkenntlichmachung personenbezogener Identifikatoren in Bildern und Videoaufnahmen, insbesondere von Gesichtern und Kfz-Kennzeichen. Ziel ist es, das Risiko der Identifizierung einer natürlichen Person im Sinne der Anonymisierung gemäß DSGVO zu minimieren. Nach Erwägungsgrund 26 DSGVO (Zitat) gelten „Informationen, die sich nicht auf eine identifizierte oder identifizierbare natürliche Person beziehen, oder personenbezogene Daten, die in einer Weise anonymisiert worden sind, dass die betroffene Person nicht oder nicht mehr identifiziert werden kann“ nicht als personenbezogene Daten (Verordnung (EU) 2016/679).
Im Kontext von Fotos und Videos umfasst KI in der Praxis eine Verarbeitungskette: Erkennung sensibler Objekte, deren zeitliches Tracking, Qualitätsprüfung, Anwendung einer Maske (z. B. Gaußsche Unschärfe, Pixelierung) sowie Export des resultierenden Materials. Deep-Learning-Methoden werden breit eingesetzt, um Modelle zur Gesichts- und Kennzeichenerkennung unter unterschiedlichen Bedingungen zu trainieren und so eine zuverlässige visuelle Anonymisierung zu gewährleisten.
Die Rolle von KI bei der Anonymisierung von Bildern und Videos
KI ermöglicht die automatische, reproduzierbare und skalierbare Unkenntlichmachung sensibler Bereiche bei möglichst geringer Beeinträchtigung des Hintergrunds. Besonders relevant ist dies bei mehrstündigem Videomaterial, bei dem eine manuelle Anonymisierung unverhältnismäßig kostenintensiv und fehleranfällig wäre.
- Detektion: Das Modell klassifiziert und lokalisiert Gesichter sowie Kfz-Kennzeichen in einzelnen Frames.
- Tracking: MOT-Algorithmen (Multi-Object Tracking) sorgen für Objektkonsistenz zwischen Frames, stabilisieren Masken und reduzieren Flackern.
- Maskierung: Einsatz von Verfahren, die eine Rekonstruktion der Inhalte im Regelfall verhindern (z. B. Gaußsche Unschärfe mit ausreichend hoher Sigma oder Pixelierung mit großer Blockgröße).
- Export: Speicherung in verlustfreien oder verlustbehafteten Codecs unter Wahrung der Integrität maskierter Bereiche.
Gallio PRO Kontext: Das System anonymisiert automatisch ausschließlich Gesichter und Kfz-Kennzeichen. Es anonymisiert keine vollständigen Silhouetten, arbeitet nicht in Echtzeit und speichert keine Detektionsprotokolle mit personenbezogenen oder sensiblen Daten. Andere Elemente (z. B. Logos, Tätowierungen, Namensschilder, Dokumente, Bildschirme) können manuell im Editor maskiert werden.
KI-Technologien für die Anonymisierung
Die Basisschicht bilden konvolutionale neuronale Netze und Single-Shot-Objektdetektoren, die auf großen Datensätzen trainiert wurden, sowie leistungsfähige Tracking-Algorithmen. Die Wahl der Architektur hängt vom Kompromiss zwischen Sensitivität (Recall), Anzahl falscher Positivmeldungen und Durchsatz ab.
- Gesichtserkennung: RetinaFace (Deng et al., 2020) mit Landmark-Regression ermöglicht eine stabile Maskierung bei Neigungen und teilweiser Verdeckung. Die Leistungsfähigkeit wird u. a. mit dem Datensatz WIDER FACE (Yang et al., 2016) bewertet.
- Kennzeichenerkennung: Modelle wie YOLOv5/YOLOv8 (Ultralytics, 2020-) oder EfficientDet, trainiert auf domänenspezifischen Datensätzen (z. B. CCPD, 2018), erkennen kleine Objekte auch bei wechselnden Lichtverhältnissen.
- Objekt-Tracking: DeepSORT (Wojke et al., 2017) und ByteTrack (Zhang et al., 2022) erhöhen die Maskierungskontinuität in dynamischen Szenen.
- Implementierung: On-Premise-Lösungen mit ONNX Runtime oder NVIDIA TensorRT erleichtern die Einhaltung der Grundsätze der Datenminimierung und Zweckbindung gemäß Art. 5 DSGVO durch lokale Verarbeitung.
Die Parametrierung (z. B. Sigma-Wert der Gaußschen Unschärfe, Pixelblockgröße, Maskenrand) sollte das Re-Identifizierungsrisiko im jeweiligen Anwendungsszenario berücksichtigen und den Leitlinien der ISO/IEC 20889:2018 zur Klassifikation von De-Identifizierungstechniken entsprechen.
Zentrale Parameter und Metriken bei der KI-gestützten Anonymisierung
Die Qualitätsbewertung sollte Detektionsmetriken mit Metriken zur Maskierungswirkung kombinieren. Nachfolgend die wichtigsten Kennzahlen und ihre operative Bedeutung.
Metrik | Definition/Hinweise | Einheit
|
|---|---|---|
Precision (P) | P = TP / (TP + FP) - Anteil korrekter Detektionen; reduziert unnötige Maskierung irrelevanter Bereiche | 0-1 |
Recall (R) | R = TP / (TP + FN) - Anteil erkannter Objekte; hoher Recall minimiert Identifizierungsrisiken | 0-1 |
F1-Score | F1 = 2PR / (P + R) - Kompromiss zwischen Precision und Recall | 0-1 |
IoU | IoU = |B∩B̂| / |B∪B̂| - Überlappung von Ground Truth und Detektion; beeinflusst mAP | 0-1 |
mAP@[τ] | Mittlere Average Precision bei IoU-Schwelle τ (z. B. 0,5 oder 0,5:0,95) - Standard in der Objektdetektion | 0-1 |
Latenz | Verarbeitungszeit pro Frame (inkl. Detektion und Maskierung) | ms/Frame |
Durchsatz | Anzahl Frames pro Sekunde bei definierter Hardware und Auflösung | fps |
FPH/FN | Falschpositive pro Stunde und Anzahl übersehener Objekte - relevant für Risiko-Audits | Anzahl |
Abdeckung | Prozentualer Anteil der Gesichts-/Kennzeichenfläche, der nach Stabilisierung maskiert ist | % |
Für Compliance-Prozesse sind insbesondere ein hoher Recall sowie ein ausreichender Maskenrand über die Objektkonturen hinaus entscheidend, um Re-Identifizierungsrisiken durch Randdetails oder Kompressionsartefakte zu reduzieren.
Herausforderungen und Grenzen
Die Wirksamkeit von Artificial Intelligence in der Anonymisierung hängt stark von den Szenenbedingungen und der Datenverteilung im Vergleich zum Trainingsdatensatz ab. Nachfolgend die wichtigsten technischen und regulatorischen Risiken.
- Bildbedingungen: Starke Bewegung, Bewegungsunschärfe, geringer Kontrast und Verdeckungen reduzieren den Recall - insbesondere bei kleinen Kennzeichen.
- Domänenvielfalt: Ungewöhnliche Schriftarten und Layouts von Kennzeichen, Gesichtsmasken, Brillen oder extreme Blickwinkel erfordern Domänenanpassung oder zusätzliches Training.
- Maskenstabilität: Ohne Tracking kann Maskenflackern auftreten; Abhilfe schaffen MOT-Algorithmen und Trajektorien-Glättung.
- Rechtliche Aspekte: Nach EDPB-Leitlinien 3/2019 kann das Abbild einer Person personenbezogene Daten darstellen; auch ein Kennzeichen kann - je nach Kontext und Identifizierbarkeit - personenbezogen sein. Vor Veröffentlichung oder Weitergabe von Material ist daher eine Risikoanalyse und Prüfung der Rechtsgrundlage erforderlich. In der Praxis werden häufig Gesichter und Kennzeichen unkenntlich gemacht.
Die Auswahl von Techniken und operativen Schwellenwerten sollte auf einer fundierten Risikoanalyse und transparenten Verarbeitungsrichtlinien basieren, unter Bezugnahme auf ISO/IEC 27001:2022 (Informationssicherheitsmanagement) und ISO/IEC 20889:2018 (Klassifikation von De-Identifizierungstechniken).
Normative Referenzen und Quellen
Die folgende Bibliografie umfasst Rechtsakte, Standards und technische Publikationen zur Verifizierung der oben beschriebenen Definitionen und Praktiken.
- DSGVO: Verordnung (EU) 2016/679, Erwägungsgrund 26 und Art. 4 - Quelle: EUR-Lex, 2016.
- EDPB: Leitlinien 3/2019 zur Verarbeitung personenbezogener Daten durch Videogeräte, Version 2.0, 2020.
- WP29/EDPB: Stellungnahme 05/2014 zu Anonymisierungstechniken (WP216), 2014.
- ISO/IEC 20889:2018 - Privacy Enhancing Data De-Identification - Terminology and Classification, ISO, 2018.
- ISO/IEC 27001:2022 - Information Security, Cybersecurity and Privacy Protection - ISMS Requirements, ISO, 2022.
- ENISA: Recommendations on Shaping Technology According to GDPR Provisions, 2019.
- RetinaFace: Jiankang Deng et al., „RetinaFace: Single-shot Multi-Level Face Localisation in the Wild“, CVPR Workshops, 2020.
- WIDER FACE: Shuo Yang et al., „WIDER FACE: A Face Detection Benchmark“, CVPR, 2016.
- YOLOv5/YOLOv8: Ultralytics Documentation and Model Cards, 2020-2023.
- CCPD: X. Xu et al., „Towards End-to-End License Plate Detection and Recognition: A Large Dataset and Baseline“, ECCV Workshops, 2018.
- DeepSORT: N. Wojke, A. Bewley, D. Paulus, „Simple Online and Realtime Tracking with a Deep Association Metric“, ICIP, 2017.
- ByteTrack: Y. Zhang et al., „ByteTrack: Multi-Object Tracking by Associating Every Detection Box“, ECCV, 2022.