Object Tracking – Definition
Object Tracking, also die Objektverfolgung in Videos über aufeinanderfolgende Frames hinweg, ist der Prozess, bei dem demselben Objekt über die gesamte Bildsequenz hinweg eine konsistente zeitliche Identität zugewiesen wird. In der Praxis der Anonymisierung von Fotos und Videoaufnahmen bedeutet das, dass eine in Frame t erkannte Person oder ein Kennzeichen als dasselbe Objekt behandelt wird, das bereits in Frame t-1, t-2 und den folgenden Frames erschienen ist. Dadurch springt die Unschärfe- oder Verpixelungsmaske nicht zwischen Objekten hin und her und verschwindet auch nicht kurzzeitig bei einem vorübergehenden Einbruch der Detektionsqualität.
In der Fachliteratur wird die Objektverfolgung in der Regel von der Detektion getrennt betrachtet. Die Detektion beantwortet die Frage, ob sich in einem bestimmten Frame ein Gesicht oder ein Kennzeichen befindet und wo es lokalisiert ist. Das Tracking beantwortet dagegen die Frage, ob es sich um dasselbe Objekt wie zuvor handelt und wie sich seine Position zwischen zwei Detektionen vorhersagen lässt. In Systemen zur Videoanonymisierung ist Object Tracking somit die Stabilisierungsschicht des Detektionsalgorithmus. Es ist besonders wichtig bei teilweisen Verdeckungen, Kamerabewegungen, Änderungen des Objektmaßstabs und kurzzeitiger Bewegungsunschärfe.
Diese Definition entspricht dem Verständnis aus der Forschung zum Multi-Object-Tracking in Videos, unter anderem in den seit 2015 entwickelten MOTChallenge-Benchmarks sowie in IEEE-Übersichtsarbeiten zum Multiple Object Tracking. Im Kontext von Gallio PRO bezieht sich der Begriff auf das Tracking von Gesichtern und Kfz-Kennzeichen zwischen Frames, um die Kontinuität der Anonymisierung von Videomaterial zu gewährleisten. Er betrifft keine Anonymisierung von Livestreams in Echtzeit, da Gallio PRO keine Echtzeit-Anonymisierung durchführt.
Die Rolle von Object Tracking bei der Videoanonymisierung
In einem System zum Verpixeln oder Unkenntlichmachen von Gesichtern und Kennzeichen reicht die reine Detektion in jedem einzelnen Frame nicht aus. Ein Detektor kann ein Objekt kurzzeitig verlieren – etwa durch Reflexionen, Bewegung, geringe Auflösung oder eine Verdeckung durch ein anderes Element der Szene. Object Tracking in Videos reduziert die Auswirkungen solcher Aussetzer und hilft dabei, die Anonymisierungsmaske an einer logisch konsistenten Position zu halten.
In der Praxis erfüllt die Objektverfolgung mehrere kritische Funktionen für Compliance und Verarbeitungsqualität:
- Sie gewährleistet die durchgehende Unkenntlichmachung desselben Gesichts oder desselben Kennzeichens über mehrere Frames hinweg.
- Sie reduziert das „Flackern“ der Maske, wenn der Detektor instabil arbeitet.
- Sie sagt die Position eines Objekts zwischen zwei Detektionen anhand eines Bewegungsmodells voraus.
- Sie senkt das Risiko einer kurzzeitigen Offenlegung personenbezogener Daten in einzelnen Frames.
- Sie ermöglicht konsistente manuelle Korrekturen im Editor, wenn die Automatik nachgebessert werden muss.
Für Datenschutzbeauftragte hat das praktische Relevanz. Ein Anonymisierungsvorfall muss nicht das gesamte Video betreffen. Bereits wenige nicht maskierte Frames können ausreichen, damit ein Gesicht oder ein Kennzeichen beim Anhalten des Bildes lesbar wird. Deshalb sollte die Objektverfolgung als Mechanismus zur Risikoreduzierung verstanden werden und nicht nur als Funktion zur optischen Verbesserung des Exports.
Wie die Verfolgung von Gesichtern und Kennzeichen zwischen Frames funktioniert
Eine typische Pipeline besteht aus Detektion, Bewegungsschätzung, Objektzuordnung und Trajektorienaktualisierung. In modernen Systemen wird die Detektion meist durch Deep-Learning-Modelle realisiert, da sich Gesichter und Kfz-Kennzeichen in Maßstab, Winkel und Bildqualität auf eine Weise verändern, die sich mit einfachen Regeln nur schwer abbilden lässt. Das KI-Modell erkennt also zunächst das Objekt, das anschließend zwischen den Frames verfolgt werden kann.
Zu den am häufigsten eingesetzten technischen Komponenten gehören:
- ein Objektdetektor – z. B. ein CNN- oder Transformer-Modell zur Erkennung von Gesichtern oder Kennzeichen in einem einzelnen Frame,
- ein Bewegungsmodell – häufig ein Kalman-Filter, klassisch von R. E. Kalman im Jahr 1960 beschrieben, zur Vorhersage der nächsten Objektposition,
- ein Assoziationsalgorithmus – z. B. ein Zuordnungsproblem, das mit dem ungarischen Algorithmus gelöst wird,
- Ähnlichkeitsmaße – IoU, Distanz visueller Merkmale sowie Übereinstimmung von Trajektorie und Bounding-Box-Größe,
- Mechanismen zur Track-Verwaltung – Initialisierung, Bestätigung, Verlust und Beendigung des Objektpfads.
Ein vereinfachtes Schema lässt sich durch folgende Formel darstellen:
Track(t) = Associate(Detections(t), Predict(Track(t-1)))
Dabei bestimmt Predict die erwartete Position des Objekts im neuen Frame, während Associate neue Detektionen den bestehenden Trajektorien zuordnet. Wenn eine Detektion kurzzeitig ausbleibt, kann der Tracker den Track für eine begrenzte Zeit auf Basis der Vorhersage aufrechterhalten. Dauert das Ausbleiben der Detektion zu lange an, wird der Track beendet.
Wichtige Parameter und Metriken für Object Tracking
Die Bewertung von Tracking sollte sich nicht auf die pauschale Aussage beschränken, ein System „tracke gut“. In der Praxis müssen die Qualität der Identitätskonsistenz, die Stabilität der Trajektorien und der Einfluss auf die Wirksamkeit der Anonymisierung messbar sein. Ein Teil der Metriken stammt direkt aus dem MOTChallenge-Umfeld sowie aus der Veröffentlichung von Bernardin und Stiefelhagen aus dem Jahr 2008 zu MOTA und MOTP.
Parameter / Metrik | Bedeutung | Relevanz für die Anonymisierung
|
|---|---|---|
ID Switches | Anzahl fehlerhafter Identitätswechsel eines verfolgten Objekts | Beeinflusst das Risiko, dass eine Maske auf das falsche Objekt übertragen wird |
MOTA | Gesamtmaß für Tracking-Fehler | Zeigt die allgemeine Stabilität beim Tracking mehrerer Objekte |
MOTP | Maß für die Lokalisierungsgenauigkeit in der klassischen Benchmark-Definition | Beeinflusst, ob die Maske Gesicht oder Kennzeichen präzise abdeckt |
HOTA | Metrik, die Detektions- und Assoziationsqualität kombiniert, veröffentlicht 2020 | Zeigt besser, wie zuverlässig ein Objekt zwischen Frames verknüpft wird |
Latency | Rechenbedingte Verzögerung der Verarbeitung | Relevant für die Prozessleistung, auch wenn dies nicht zwingend Echtzeitverarbeitung bedeutet |
Track Fragmentation | Anzahl der Aufteilungen einer Trajektorie in mehrere kurze Tracks | Erhöht das Risiko kurzzeitiger Lücken in der Anonymisierung |
Bei Anwendungen zum Schutz der Privatsphäre ist insbesondere eine niedrige Zahl von False Negatives, also übersehenen Objekten, entscheidend. Aus Compliance-Sicht ist es oft besser, eine etwas größere Fläche zu maskieren, als einen sichtbaren Teil eines Gesichts oder Kennzeichens ungeschützt zu lassen.
Herausforderungen und Grenzen von Object Tracking
Tracking beseitigt nicht alle Probleme. Seine Wirksamkeit hängt von der Qualität der Eingangserkennung, der Bildrate, der Videokompression, den Lichtverhältnissen und dem Grad der Verdeckung des Objekts ab. Teilweise abgewandte Gesichter, kleine Kennzeichen im Hintergrund oder starke Kompressionsartefakte mindern die Stabilität der Objektverfolgung in Videos.
Zu den häufigsten Einschränkungen gehören:
- teilweise oder vollständige Verdeckung des Objekts durch andere Personen oder Fahrzeuge,
- schnelle Kamerabewegungen und Motion Blur,
- eine zu geringe Pixelzahl für Gesicht oder Kennzeichen,
- ein ähnliches Erscheinungsbild mehrerer Objekte in derselben Szene,
- Fehler, die vom Detektor vererbt werden und vom Tracking allein nicht korrigiert werden können.
Wichtig ist außerdem eine korrekte Definition des Automatisierungsumfangs. Gallio PRO erkennt und anonymisiert Gesichter und Kfz-Kennzeichen automatisch. Logos, Tätowierungen, Namensschilder, Dokumente oder Bildinhalte auf Monitoren werden nicht automatisch erkannt. Solche Elemente können im Editor manuell unkenntlich gemacht werden. Aus Sicht des Trackings bedeutet das, dass nur jene Objektklassen verfolgt werden, die das System tatsächlich automatisch erkennt.
Normative Bezüge und praktische Bedeutung für die Compliance
Die Objektverfolgung ist keine eigenständige rechtliche Pflicht, die ausdrücklich in der DSGVO genannt wird. Sie ist jedoch eine technische Methode zur Unterstützung des Grundsatzes der Integrität und Vertraulichkeit nach Art. 5 Abs. 1 lit. f sowie der Sicherheit der Verarbeitung nach Art. 32 der Verordnung (EU) 2016/679. Wenn ein Verantwortlicher Videomaterial anonymisiert, ist die Stabilität dieser Anonymisierung für die tatsächliche Wirksamkeit der technischen Maßnahme von wesentlicher Bedeutung. Kurze Lücken zwischen Frames können den praktischen Schutzeffekt erheblich beeinträchtigen.
Bei Gesichtern können zusätzlich Vorschriften zum Recht am eigenen Bild aus dem Zivil- und Urheberrecht relevant sein. Bei Kfz-Kennzeichen ist die Rechtslage in Polen nicht einheitlich; in vielen europäischen Staaten können Praxis und datenschutzrechtliche Auslegung jedoch zu einer Maskierung führen. Aus technischer Sicht erhöht Object Tracking die Konsistenz dieser Maskierung im gesamten Videomaterial.