Co to jest Maskowanie PII (Personally Identifiable Information)?

Maskowanie PII - definicja

Maskowanie PII w kontekście obrazów i nagrań wideo to kontrolowany, techniczny proces trwałego ukrywania elementów w kadrze, które umożliwiają identyfikację osoby fizycznej. W Unii Europejskiej pojęcie PII w praktyce odpowiada zakresowi „danych osobowych” z art. 4 ust. 1 Rozporządzenia (UE) 2016/679 (RODO), czyli wszelkim informacjom o zidentyfikowanej lub możliwej do zidentyfikowania osobie. W praktyce materiałów wizualnych do kluczowych identyfikatorów należą twarze oraz tablice rejestracyjne pojazdów. Maskowanie stosuje się w celu ograniczenia ryzyka ponownej identyfikacji i spełnienia zasady minimalizacji danych oraz niezbędności przetwarzania.

Skuteczna anonimizacja według wytycznych organów (WP29, EDPB, CNIL) wymaga, aby proces był praktycznie nieodwracalny przy użyciu rozsądnie dostępnych środków. Oznacza to dobór metod zamazywania i parametrów w taki sposób, by uniemożliwić identyfikację jednostki, pojedynczo lub przez łączenie informacji, przy zachowaniu użyteczności materiału do zadeklarowanego celu.

Rola maskowania PII w anonimizacji zdjęć i wideo

Maskowanie PII jest podstawowym środkiem redukcji ryzyka w obszarze monitoringu, publikacji materiałów prasowych, archiwizacji badań UX oraz udostępniania danych treningowych do AI. EDPB wskazuje, że przetwarzanie danych z urządzeń wizyjnych musi respektować zasadę proporcjonalności oraz ograniczenia celu, a ujawnianie wizerunku czy numerów pojazdów wymaga podstawy prawnej i adekwatności do celu publikacji.

  • Twarze: wizerunek osoby jest daną osobową. Jeżeli służy do unikalnej identyfikacji na podstawie cech biometrycznych (np. w systemach rozpoznawania twarzy), przetwarzane dane mogą stanowić dane biometryczne będące szczególną kategorią danych (art. 9 RODO).
  • Tablice rejestracyjne: w wielu państwach UE organy nadzorcze traktują je jako dane osobowe, gdy pozwalają na identyfikację właściciela lub użytkownika pojazdu przez dostępne rejestry. W Polsce występują rozbieżności interpretacyjne w zależności od kontekstu przetwarzania; w praktyce rekomendowane jest maskowanie przy upublicznianiu.
  • Wyjątki od obowiązku uzyskania zgody na rozpowszechnianie wizerunku wynikają z prawa autorskiego (art. 81): osoba powszechnie znana, wizerunek jako szczegół większej całości (np. zgromadzenie), lub zgoda udzielona za zapłatą.

Technologie maskowania PII w obrazie i wideo

Automatyzacja skutecznego maskowania PII w materiałach wizualnych opiera się na detekcji i lokalizacji obiektów w kadrach oraz na przetwarzaniu przestrzenno-czasowym. Do zbudowania modeli wykrywania twarzy i tablic rejestracyjnych wykorzystuje się uczenie głębokie - m.in. konwolucyjne sieci neuronowe oraz architektury detekcyjne z rodziny one-stage i two-stage, a także nowsze modele transformerowe. Zaimplementowany model AI jest następnie stosowany operacyjnie do wykrywania obszarów do zamazania.

  • Detekcja i śledzenie: wykrywanie (per klatka), następnie śledzenie obiektów w czasie dla spójności maski (algorytmy SORT, DeepSORT lub równoważne).
  • Rozszerzanie regionu: margines wokół detekcji, aby skompensować błędy lokalizacji i ruch kamery.
  • Metody ukrywania: rozmycie Gaussa, pikselizacja (mosaic), wypełnienie stałe lub teksturą. Dobór parametrów powinien minimalizować ryzyko odwrócenia i reidentyfikacji.
  • Przetwarzanie on-premise: ogranicza transfer danych do podmiotów trzecich i ułatwia kontrolę łańcucha przetwarzania.

Oprogramowanie klasy Gallio PRO automatycznie maskuje wyłącznie twarze oraz tablice rejestracyjne. Nie wykonuje anonimizacji w czasie rzeczywistym i nie prowadzi tzw. anonimizacji strumienia wideo. Maskowanie logotypów, tatuaży czy dokumentów na nagraniach jest możliwe ręcznie w edytorze. System nie gromadzi logów zawierających detekcje twarzy i tablic ani innych danych osobowych.

Kluczowe parametry i metryki jakości maskowania

Ocena jakości maskowania PII łączy metryki detekcji, lokalizacji i wydajności obliczeniowej oraz testy odporności prywatności. Poniższa tabela porządkuje najczęściej stosowane miary w projektach anonimizacji obrazu i wideo.

Metryka

Definicja

Znaczenie dla prywatności

 

Precision

TP / (TP + FP)

Niższy odsetek fałszywych alarmów ogranicza nadmierne maskowanie.

Recall

TP / (TP + FN)

Krytyczne - minimalizuje ryzyko pozostawienia niezamaskowanej twarzy/tablicy.

F1

2 Precision Recall / (Precision + Recall)

Równoważy skuteczność wykryć i ich trafność.

IoU

Przecięcie/Unia pól detekcji i referencji

Kontroluje, czy maska w pełni przykrywa obszar identyfikujący.

mAP

Średnia AP po progach IoU

Poglądowa jakość detektora na różnych poziomach dopasowania.

Latency

ms/klatkę lub ms/obraz

Planowanie zasobów; ważne w przetwarzaniu wsadowym.

Throughput

kl./s lub obrazów/s

Skalowanie produkcyjne i SLA dla kolejek zadań.

Test odwracalności

Ocena podatności na deblur i super-resolucję

Waliduje nieodwracalność przekształcenia (wymóg anonimizacji).

Audyty manualne

Przegląd próbek ryzykownych

Wykrywa przypadki brzegowe niewychwycone metrykami.

Wyzwania i ograniczenia

Maskowanie PII w obrazach i wideo napotyka trudności techniczne i prawne. Jakość detekcji spada w warunkach słabego światła, silnego poruszenia, zasłonięcia obiektów, niekorzystnych kątów czy małej rozdzielczości. Słaba lokalizacja prowadzi do niedomaskowania, a zbyt agresywne filtry obniżają użyteczność materiału. Pixelacja i lekkie rozmycie mogą być częściowo odwracalne przy użyciu algorytmów super-resolucji - dlatego parametry należy dobierać konserwatywnie. Automatyka zwykle obejmuje jedynie twarze i tablice; inne elementy PII wymagają edycji ręcznej i procedur kontroli jakości. Dodatkowo, różnice w interpretacjach prawnych (np. tablice rejestracyjne w Polsce) wymagają polityk zgodności dopasowanych do jurysdykcji i celu przetwarzania.

Odniesienia normatywne i źródła

Poniżej zebrano kluczowe akty i normy kształtujące wymagania i dobre praktyki dla maskowania PII w materiałach wizualnych. Dokumenty te określają pojęcia danych osobowych, kryteria skutecznej anonimizacji oraz ramy zarządzania prywatnością.

  • RODO - Rozporządzenie (UE) 2016/679, art. 4 ust. 1 i art. 9. Tekst urzędowy: https://eur-lex.europa.eu/eli/reg/2016/679/oj
  • EDPB, Guidelines 3/2019 on processing of personal data through video devices (przyjęte 29.01.2020): https://edpb.europa.eu/our-work-tools/our-documents/guidelines/guidelines-32019-processing-personal-data-through-video_en
  • Grupa Robocza Art. 29, Opinion 05/2014 on Anonymisation Techniques: https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2014/wp216_en.pdf
  • ISO/IEC 20889:2018, Privacy enhancing data de-identification terminology and classification: https://www.iso.org/standard/69373.html
  • ISO/IEC 29100:2011, Privacy framework: https://www.iso.org/standard/45123.html
  • CNIL, Anonymisation - guide and methodology (aktualizowane): https://www.cnil.fr/en/anonymisation
  • ICO, Anonymisation guidance (2022+): https://ico.org.uk/for-organisations/uk-gdpr-guidance-and-resources/anonymisation/
  • Ustawa o prawie autorskim i prawach pokrewnych, art. 81 (wizerunek): https://isap.sejm.gov.pl/isap.nsf/DocDetails.xsp?id=WDU19940240083