Was ist Occlusion Handling (Umgang mit verdeckten Gesichtern)?

Occlusion Handling (Umgang mit verdeckten Gesichtern) – Definition

Occlusion Handling bezeichnet eine Reihe von Verfahren zur Erkennung, Verfolgung und korrekten Unkenntlichmachung von Gesichtern, die auf einem Foto oder in einem Video teilweise verdeckt sind. Im Kontext der Anonymisierung bedeutet dies Situationen, in denen das System ein Gesicht trotz unvollständig sichtbarer Merkmale erkennen soll, etwa wenn das Gesicht durch eine Maske, eine Brille, eine Hand, einen Helm, Haare, einen Pfosten, ein Kleidungsstück oder eine andere Person verdeckt wird.

Aus technischer Sicht handelt es sich dabei nicht um eine eigenständige Technologie, sondern um eine Eigenschaft und einen Satz von Verfahren des Gesichtserkennungsmodells sowie der nachgelagerten Anonymisierungsstufe. Ziel ist nicht die Identifizierung einer Person, sondern die Aufrechterhaltung einer hohen Erkennungsrate von Gesichtern bei teilweisem Verlust visueller Informationen. In der Praxis bedeutet das, dass das KI-Modell lernen muss, ein Gesicht anhand unvollständiger geometrischer und texturbasierter Muster zu erkennen und die Position anschließend an das Blur- oder Maskierungsmodul zu übergeben.

In Systemen zur Anonymisierung von Fotos und Videoaufnahmen hat Occlusion Handling unmittelbare Bedeutung für die Konformität des Prozesses mit dem Grundsatz Privacy by Design gemäß Art. 25 DSGVO, da das Übersehen eines teilweise verdeckten Gesichts zur unbeabsichtigten Offenlegung personenbezogener Daten führen kann. Bei Modellen auf Basis von Deep Learning ist ein vorheriges Training des neuronalen Netzes auf Datensätzen mit Fällen teilweiser Okklusion erforderlich. Der bloße Einsatz von KI ohne ein entsprechend vorbereitetes Modell löst das Problem nicht.

Die Rolle verdeckter Gesichter bei der Anonymisierung von Fotos und Videos

Unter Standardbedingungen basiert die Gesichtserkennung auf einer vollständigen Anordnung von Merkmalen wie Augen, Nase, Mund und Gesichtskontur. Wenn ein Teil dieser Elemente fehlt, steigt das Risiko eines False Negative, also eines nicht erkannten Gesichts, das tatsächlich im Bild vorhanden ist. Für den Anonymisierungsprozess ist dies ein kritischer Fehler, weil dadurch ein Gesicht unmaskiert bleibt.

Der Umgang mit Okklusionen ist besonders wichtig bei Überwachungsmaterial, Dashcam-Aufnahmen, Felddokumentation, Material von öffentlichen Veranstaltungen und Aufnahmen in Bewegung. In solchen Daten treten häufig auf:

  • unvollständige Gesichtsprofile,
  • kurzzeitige Verdeckungen zwischen einzelnen Frames,
  • eine geringe Objektauflösung,
  • starke Lichtwechsel,
  • Überlagerungen mehrerer Personen in einer Szene.

In der Praxis erfordert eine hohe Wirksamkeit der Anonymisierung, dass das System nicht jeden einzelnen Frame isoliert vom Kontext bewertet. In Videomaterial wird daher nicht nur die Detektion, sondern auch das Object Tracking zwischen den Frames eingesetzt, sodass die Anonymisierungsmaske auch dann erhalten bleibt, wenn das Gesicht für einige Frames teilweise verschwindet.

Technologien, die beim Occlusion Handling eingesetzt werden

Ein wirksamer Umgang mit verdeckten Gesichtern basiert in der Regel auf der Kombination mehrerer Verarbeitungsebenen. In modernen Lösungen bilden Deep-Learning-Modelle die Grundlage, meist in Form von konvolutionalen neuronalen Netzen oder Detektoren mit einstufiger und zweistufiger Architektur.

Am häufigsten werden folgende technische Ansätze verwendet:

  • Gesichtserkennung, die auf Datensätzen mit teilweiser Okklusion trainiert wurde,
  • Schätzung von Gesichtslandmarken, selbst wenn ein Teil der Landmarken nicht sichtbar ist,
  • Objektverfolgung in Videosequenzen mit Tracking-by-Detection-Methoden,
  • Aggregation von Ergebnissen zwischen Frames,
  • Konfidenzschwellen mit zusätzlicher Sicherheitsregel für Randbereiche.

In der Forschungsliteratur wird häufig der 2016 veröffentlichte Benchmark WIDER FACE verwendet, der eine große Bandbreite hinsichtlich Skalierung, Pose, Mimik und Gesichtsokklusion abdeckt. Dieser Datensatz wird allgemein zur Bewertung von Gesichtserkennungsmodellen unter schwierigen Szenenbedingungen genutzt. Die für diesen Benchmark berichteten Ergebnisse werden in der Regel als Average Precision – AP – getrennt für die Stufen Easy, Medium und Hard angegeben. Die Kategorie Hard umfasst unter anderem kleine Gesichter und starke Okklusionen.

In einem System wie Gallio PRO ist unter Occlusion Handling die Fähigkeit des Moduls zur automatischen Gesichtserkennung zu verstehen, auch bei teilweiser Verdeckung wirksam zu bleiben. Wenn die automatische Erkennung für ein bestimmtes Material nicht ausreicht, kann die Korrektur manuell im Editor vorgenommen werden. Dies betrifft jedoch ausschließlich Objekte, die vom Benutzer unterstützt oder manuell markiert werden. Gallio PRO anonymisiert automatisch Gesichter und Kfz-Kennzeichen. Logos, Tätowierungen, Ausweise, Dokumente oder Inhalte auf Monitorbildschirmen werden nicht automatisch erkannt.

Zentrale Parameter und Metriken für Occlusion Handling

Die Bewertung der Qualität beim Umgang mit verdeckten Gesichtern sollte sich nicht auf die allgemeine Erkennungsleistung beschränken. Erforderlich sind Metriken, die auf Daten mit teilweisen und starken Okklusionen gemessen werden. Andernfalls kann das Ergebnis aus Sicht der Anonymisierung irreführend sein.

Parameter / Metrik

Bedeutung

Relevanz für die Anonymisierung

 

Recall

Anteil der tatsächlich vorhandenen Gesichter, die vom Modell erkannt wurden

Wichtigster Indikator zur Reduzierung übersehener Gesichter

Precision

Anteil korrekter Erkennungen an allen Erkennungen

Beeinflusst die Anzahl unnötiger Maskierungen

AP auf einem Datensatz mit Okklusion

Durchschnittliche Präzision, bestimmt anhand der Precision-Recall-Kurve für ein definiertes Matching-Kriterium, meist bei einem festgelegten IoU-Schwellenwert

Ermöglicht den Vergleich von Modellen unter schwierigen Bedingungen

IoU – Intersection over Union

Grad der Überlappung zwischen Detektionsrahmen und Referenzbereich

Beeinflusst, ob die Unschärfe den gesamten Gesichtsbereich abdeckt

Latency

Verarbeitungszeit eines Frames oder einer Datei

Wichtig für Batch-Verarbeitung und Systeme mit annähernder Echtzeitverarbeitung

False Negative Rate

Anteil nicht erkannter Gesichter

Fehler mit dem höchsten rechtlichen und operativen Risiko

Vereinfacht lässt sich Recall mit folgender Formel darstellen:

Recall = TP / (TP + FN)

Dabei steht TP für korrekt erkannte Gesichter und FN für übersehene Gesichter. In Anwendungen mit Bezug zum Datenschutz wird in der Regel eine Konfiguration bevorzugt, die den Recall erhöht, selbst auf Kosten eines moderaten Anstiegs von False Positives, da eine übermäßige Unkenntlichmachung meist weniger riskant ist als eine fehlende Anonymisierung.

Herausforderungen und Grenzen beim Umgang mit verdeckten Gesichtern

Selbst gute Modelle haben Grenzen. Das Problem nimmt zu, wenn die Okklusion mit einer kleinen Gesichtsgröße, Bewegungsunschärfe, geringem Kontrast und einem ungewöhnlichen Kamerawinkel zusammentrifft. Unter solchen Bedingungen kann das System fälschlicherweise annehmen, dass das Objekt nicht genügend Hinweise enthält, um als Gesicht markiert zu werden.

Zu den häufigsten Einschränkungen gehören:

  • starke Okklusion, die die Informationsschwelle des Modells überschreitet,
  • instabile Erkennungen zwischen benachbarten Frames,
  • Leistungsabfall bei sehr kleinen Gesichtern,
  • Abhängigkeit von der Qualität der Trainingsdaten,
  • Unterschiede zwischen Benchmark und tatsächlichem Ausgangsmaterial.

Aus diesem Grund sollte der Anonymisierungsprozess eine qualitative Validierung, die Wahl eines geeigneten Konfidenzschwellenwerts und bei Material mit erhöhtem Risiko auch eine Kontrolle durch einen Operator umfassen. Das ist insbesondere dann wichtig, wenn die Aufnahme veröffentlicht oder an Dritte weitergegeben werden soll.

Normative Bezüge und praktischer Compliance-Kontext

Der Umgang mit verdeckten Gesichtern ist weder in der DSGVO noch in ISO-Normen als eigenständige technische Pflicht gesondert definiert. Seine Relevanz ergibt sich jedoch aus den allgemeinen Grundsätzen der Verarbeitung personenbezogener Daten und der Sicherheit der Verarbeitung. Insbesondere sind relevant:

  • Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates – DSGVO, insbesondere Art. 5, Art. 25 und Art. 32,
  • ISO/IEC 23894:2023 – Artificial intelligence – Guidance on risk management,
  • ISO/IEC 27001:2022 – Informationssicherheits-Managementsystem,
  • NIST AI RMF 1.0, 2023 – Leitlinien für das Risikomanagement von KI-Systemen.

Aus Sicht eines Datenschutzbeauftragten sollte die praktische Bewertung nicht nur die Frage umfassen, ob ein System Gesichter erkennt, sondern auch, wie es sich bei Okklusionen verhält, welchen Recall es auf schwierigen Daten erreicht und ob ein Verfahren zur manuellen Korrektur vorgesehen ist. Bei Gallio PRO ist außerdem relevant, dass die Lösung als On-Premise-Software betrieben wird, keine Anonymisierung von Videostreams und keine Echtzeit-Anonymisierung durchführt und keine Logs sammelt, die Gesichtserkennungen oder Kennzeichenerkennungen enthalten.