Was ist maschinelles Lernen (Machine Learning, ML)?

Inhaltsverzeichnis

Maschinelles Lernen - Definition
Die Rolle von ML bei der Bild- und Videoanonymisierung
ML-Technologien und -Architekturen zur Gesichts- und Kennzeichenerkennung
Zentrale Parameter und Metriken für ML-basierte Anonymisierung
Herausforderungen und Einschränkungen
Anwendungsbeispiele
Normative Verweise und Quellen

Maschinelles Lernen - Definition

Maschinelles Lernen (Machine Learning, ML) bezeichnet eine Sammlung von Methoden, die es Computersystemen ermöglichen, Muster aus Daten zu erkennen und Entscheidungen zu treffen, ohne explizit programmierte Regeln zu verwenden. Die internationale Norm ISO/IEC 22989:2022 definiert ML als einen Ansatz der künstlichen Intelligenz, bei dem Modelle ihre Leistung bei einer bestimmten Aufgabe durch Erfahrung aus Daten verbessern (Quelle: ISO/IEC 22989:2022). Das NIST AI Risk Management Framework (AI RMF 1.0) betont den Lebenszyklus von KI-Systemen - einschließlich ML-Komponenten - mit Phasen wie Datenaufbereitung, Training, Validierung, Implementierung und Monitoring (Quelle: NIST AI RMF 1.0, 2023).

Im Kontext der Bild- und Videoanonymisierung dient Machine Learning der automatischen Erkennung von Objekten, die unkenntlich gemacht werden müssen. Dabei handelt es sich vor allem um Gesichter und Kennzeichen (Nummernschilder). Ein auf annotierten Daten trainiertes Modell identifiziert Objekte in einzelnen Frames und gibt deren Position sowie eine Konfidenzbewertung aus. Das Detektionsergebnis wird zur Erzeugung von Unschärfe- oder Pixelmasken genutzt, um das Risiko der Identifizierung von Personen oder Fahrzeugen gemäß DSGVO und den Leitlinien der Aufsichtsbehörden zu reduzieren (Quellen: EDPB 3/2019, WP29 05/2014, ISO/IEC 20889:2018).

Die Rolle von ML bei der Bild- und Videoanonymisierung

Eine effektive Anonymisierung von Bildern und Videos erfordert die zuverlässige Lokalisierung sensibler Inhalte. Regelbasierte heuristische Ansätze stoßen bei wechselnden Lichtverhältnissen, mobilen Kameras oder teilweisen Verdeckungen schnell an ihre Grenzen. ML - insbesondere Deep Learning - bietet durch Training auf großen Referenzdatensätzen eine hohe Robustheit gegenüber solchen Variationen. Für eine automatisierte Unkenntlichmachung ist zunächst ein Detektionsmodell mit geeigneter Sensitivität und Präzision zu entwickeln und anschließend in den Verarbeitungsprozess zu integrieren.

Eine typische Verarbeitungskette umfasst Videodekodierung, Objekterkennung, optionales Tracking zwischen Frames, Maskenerstellung und Export. Gallio PRO automatisiert die Erkennung und Unkenntlichmachung ausschließlich von Gesichtern und Kennzeichen. Logos, Tätowierungen, Namensschilder oder Bildschirminhalte werden nicht automatisch erkannt, können jedoch manuell im Editor bearbeitet werden. Die Software arbeitet im Batch-Modus und nicht in Echtzeit. Eine On-Premise-Implementierung ermöglicht die Datenverarbeitung innerhalb der Organisation und reduziert Datenübertragungen. Gallio PRO speichert keine Detektionsprotokolle mit personenbezogenen oder sensiblen Daten.

ML-Technologien und -Architekturen zur Gesichts- und Kennzeichenerkennung

Die Objekterkennung in Bildern basiert überwiegend auf tiefen neuronalen Netzen. Die Wahl der Architektur hängt in der Praxis vom Kompromiss zwischen Genauigkeit und Geschwindigkeit sowie von verfügbaren Rechenressourcen (CPU, GPU) ab. Die Modelle werden überwacht (supervised) mit annotierten Bounding-Box- oder Maskendatensätzen trainiert.

Konvolutionale Detektionsnetzwerke - z. B. Faster R-CNN, RetinaNet, YOLOv3 sowie neuere YOLO-Versionen (YOLOv5-YOLOv8); effizient bei der Gesichts- und Kennzeichenerkennung, verbreitet in Anwendungen mit geringer Latenz (Quellen: Ren 2015, Lin 2017, Redmon 2018).
Vision Transformer - z. B. DETR und Varianten; vereinfachen das Matching von Vorhersagen, erfordern jedoch höhere Rechenleistung und eignen sich für komplexe Szenen (Quelle: Carion 2020).
Segmentierung - bei unregelmäßigen Maskenformen kommen Segmentierungsnetzwerke zum Einsatz; für die Unkenntlichmachung von Gesichtern und Kennzeichen genügen meist rechteckige Bounding-Boxen.
Objekt-Tracking - stabilisiert Masken zwischen Frames und reduziert Flackern; typischerweise als Post-Processing eingesetzt.
Datenaufbereitung - Datensätze wie WIDER FACE oder Kennzeichen-Benchmarks liefern Referenzmetriken für Detektionsleistung und IoU (Quelle: Yang 2016; Benchmark-Praxis).

Zentrale Parameter und Metriken für ML-basierte Anonymisierung

Die Bewertung der Modellqualität beeinflusst unmittelbar das Risiko einer Identitätsoffenlegung sowie die Betriebskosten. Nachfolgend zentrale Metriken aus der Objekterkennung und Inferenzbewertung.

Metrik	Definition	Einheit/Bereich	Quelle
Precision	TP/(TP+FP)	0-1	Powers 2011
Recall	TP/(TP+FN)	0-1	Powers 2011
mAP	Mittlerer AP über Klassen (und ggf. IoU-Schwellen)	0-1	COCO, Lin 2014
IoU	Verhältnis der Schnittmenge zur Vereinigungsmenge von Detektion und Ground Truth	0-1	COCO, Lin 2014
FPR	FP/(FP+TN)	0-1	Powers 2011
Inferenzlatenz	Verarbeitungszeit pro Frame	ms	MLPerf Inference v3.0
Durchsatz	Anzahl verarbeiteter Frames pro Sekunde	fps	MLPerf Inference v3.0

In der Praxis ist bei der Anonymisierung häufig ein hoher Recall wichtiger als eine hohe Precision - eine verpasste Detektion birgt ein höheres Risiko als eine übermäßige Unkenntlichmachung. Die Wahl des Konfidenzschwellenwerts sollte dokumentiert und im Rahmen einer Risikoanalyse gemäß ISO/IEC 23894:2023 und NIST AI RMF 1.0 begründet werden.

Herausforderungen und Einschränkungen

Modelle können bei Verdeckungen, ungewöhnlichen Perspektiven oder niedriger Auflösung einen reduzierten Recall aufweisen. Die Balance zwischen Recall und Precision erfordert eine sorgfältige Schwellenwertwahl und gegebenenfalls Tracking. Trainingsdaten mit geografischem oder hardwarebedingtem Bias beeinträchtigen die Generalisierungsfähigkeit - regelmäßige Datenprüfungen und Kreuzvalidierung sind daher notwendig. Da keine Echtzeitverarbeitung erfolgt, sind Batch-Planung sowie GPU- und I/O-Management zu berücksichtigen.

Rechtliche Anforderungen sind kontextabhängig. Die Pflicht zur Unkenntlichmachung von Kennzeichen hängt vom Zweck und der Rechtsgrundlage der Verarbeitung sowie davon ab, ob unter den konkreten Umständen eine Identifizierung möglich ist; eine einheitliche allgemeine Verpflichtung im EU-Recht besteht nicht. Auch die Anonymisierung von Gesichtern ergibt sich nicht automatisch aus der DSGVO, sondern hängt von der Rechtsgrundlage und der Einhaltung der Verarbeitungsgrundsätze ab. Darüber hinaus kann die Veröffentlichung von Bildnissen dem Zivil- und Urheberrecht unterliegen. Grundsätzlich ist eine Einwilligung zur Verbreitung erforderlich, mit typischen Ausnahmen: Personen des öffentlichen Lebens im Rahmen ihrer Funktion, Personen als Beiwerk einer Gesamtaufnahme (z. B. Versammlung, Landschaft, öffentliche Veranstaltung) oder bei vereinbarter Vergütung für das Posieren. Aus Datenschutzsicht unterstützen die Minimierung von Detektionsprotokollen und On-Premise-Implementierungen die Prinzipien „Privacy by Design“ und „Privacy by Default“.

Anwendungsbeispiele

Maschinelles Lernen unterstützt die Anonymisierung von Überwachungsvideos, Dashcam-Aufnahmen und mobilen Kameradaten, etwa bei der Bearbeitung von Auskunftsanträgen nach DSGVO, der Weitergabe von Beweismitteln in Verfahren, der Veröffentlichung von Aufnahmen öffentlicher Veranstaltungen oder der Archivierung von Schulungsmaterial. Entscheidend sind auditierbare Metriken, die Kontrolle des Detektionsschwellenwerts und die Möglichkeit manueller Nachbearbeitung. In sicherheitskritischen Umgebungen reduziert eine On-Premise-Verarbeitung die Angriffsfläche erheblich.

Normative Verweise und Quellen

ISO/IEC 22989:2022 - Artificial Intelligence - Concepts and terminology.
ISO/IEC 23894:2023 - Artificial Intelligence - Risk management.
ISO/IEC 20889:2018 - Privacy enhancing data de-identification - Terminology and classification of techniques.
NIST AI Risk Management Framework 1.0, 2023.
Verordnung (EU) 2016/679 (DSGVO) - Art. 4 und Erwägungsgründe zu personenbezogenen Daten.
European Data Protection Board, Guidelines 3/2019 on processing of personal data through video devices, Version 2.0, 2020.
Article 29 Working Party, Opinion 05/2014 on Anonymisation Techniques, 2014.
Lin et al., Microsoft COCO: Common Objects in Context, ECCV 2014.
Yang et al., WIDER FACE: A Face Detection Benchmark, CVPR 2016.
MLCommons, MLPerf Inference v3.0 Results and Rules, 2023.
Ren et al., Faster R-CNN, NIPS 2015; Redmon et al., YOLOv3, 2018; Carion et al., DETR, ECCV 2020.

Siehe auch

Zurück zum Glossar