Czym jest face template / faceprint (wzorzec twarzy)?

Face template / faceprint (wzorzec twarzy) - definicja

Face template, nazywany też faceprintem, to cyfrowa reprezentacja cech twarzy wyliczona przez algorytm rozpoznawania twarzy z obrazu lub klatki wideo. Nie jest to zwykłe zdjęcie. W praktyce chodzi o wektor cech, mapę charakterystycznych punktów albo inny zapis matematyczny, który pozwala porównywać jedną twarz z inną. Taki wzorzec powstaje po detekcji twarzy, wyrównaniu obrazu i ekstrakcji cech przez model uczenia maszynowego, najczęściej deep learning.

W kontekście ochrony danych wzorzec twarzy ma znaczenie szczególne. Jeżeli jest przetwarzany w celu jednoznacznego zidentyfikowania osoby fizycznej, co do zasady wchodzi w zakres danych biometrycznych. Wynika to z art. 4 pkt 14 RODO, który definiuje dane biometryczne jako dane osobowe wynikające ze specjalnego przetwarzania technicznego dotyczącego cech fizycznych, fizjologicznych lub behawioralnych osoby fizycznej, umożliwiające lub potwierdzające jednoznaczną identyfikację tej osoby, takie jak wizerunek twarzy lub dane daktyloskopijne. Sam obraz twarzy nie zawsze jest daną biometryczną, ale face template używany do identyfikacji lub weryfikacji zwykle będzie traktowany właśnie w ten sposób.

Dla administratorów nagrań i zdjęć jest to rozróżnienie praktyczne. System, który jedynie wykrywa twarz po to, aby ją zamazać, nie musi tworzyć trwałego wzorca twarzy przypisanego do osoby. Jeżeli jednak rozwiązanie buduje i przechowuje faceprinty, aby śledzić tę samą osobę między ujęciami, porównywać ją z bazą referencyjną albo umożliwiać wyszukiwanie po twarzy, zakres ryzyka prawnego i technicznego rośnie istotnie.

Jak powstaje wzorzec twarzy w przetwarzaniu zdjęć i wideo

W przetwarzaniu obrazu face template nie pojawia się na etapie samego zapisu materiału. Jest tworzony przez pipeline analityczny. To ważne, bo w systemach do anonimizacji zdjęć i nagrań można oddzielić prostą detekcję twarzy od biometrycznego rozpoznawania osoby.

Typowy proces techniczny obejmuje następujące etapy:

  • detekcję twarzy w kadrze - znalezienie obszaru obejmującego twarz,
  • landmark detection - wyznaczenie punktów charakterystycznych, np. oczu, nosa i kącików ust,
  • alignment - normalizację położenia, skali i obrotu twarzy,
  • feature extraction - obliczenie wektora cech przez sieć neuronową,
  • matching - porównanie wzorca z innym wzorcem za pomocą miary podobieństwa.

W nowoczesnych systemach wektor cech ma zwykle od 128 do 1024 wymiarów, zależnie od architektury modelu. Porównanie odbywa się najczęściej przez cosine similarity albo dystans euklidesowy. Im mniejszy dystans lub wyższe podobieństwo kosinusowe, tym większe prawdopodobieństwo, że chodzi o tę samą osobę. To jednak nie jest tożsamość pewna, tylko wynik zależny od progu decyzyjnego i charakterystyki modelu.

W praktyce anonimizacji zdjęć i wideo deep learning jest istotny z innego powodu. To właśnie modele głębokiego uczenia są dziś standardem dla skutecznej detekcji twarzy w zróżnicowanych warunkach - przy częściowym zasłonięciu, zmianie oświetlenia, kącie widzenia czy niskiej jakości nagrania. Taki model może służyć wyłącznie do wykrycia twarzy i nałożenia maski rozmycia, bez budowania bazy faceprintów.

Status prawny face template w RODO i praktyce compliance

Z perspektywy compliance kluczowe jest pytanie o cel przetwarzania. RODO nie zakazuje każdego technicznego operowania na obrazie twarzy, ale szczególnie rygorystycznie traktuje dane biometryczne używane do jednoznacznej identyfikacji. Ma to znaczenie przy systemach wideo, monitoringu, archiwizacji materiałów i udostępnianiu nagrań.

Najważniejsze konsekwencje prawne są następujące:

  • jeżeli face template służy do identyfikacji osoby, co do zasady może stanowić szczególną kategorię danych osobowych w rozumieniu art. 9 ust. 1 RODO,
  • administrator musi wykazać podstawę z art. 6 RODO oraz, gdy zachodzi art. 9, także wyjątek z art. 9 ust. 2 RODO,
  • konieczna jest ocena niezbędności, proporcjonalności i celu przetwarzania,
  • w wielu przypadkach wymagane będzie przeprowadzenie DPIA zgodnie z art. 35 RODO, zwłaszcza przy systematycznym monitorowaniu na dużą skalę lub stosowaniu nowych technologii,
  • należy wdrożyć privacy by design i privacy by default zgodnie z art. 25 RODO.

Wytyczne Europejskiej Rady Ochrony Danych wskazują, że przetwarzanie biometryczne wymaga analizy kontekstu, celu i skutku dla osoby, której dane dotyczą. Podobnie orzecznictwo i stanowiska organów nadzorczych rozróżniają zwykłe utrwalenie wizerunku od przetwarzania go do celów identyfikacyjnych. Dla administratora materiałów wideo oznacza to, że sama obecność twarzy w kadrze nie jest tożsama z tworzeniem faceprintu, ale wdrożenie funkcji rozpoznawania osób istotnie zmienia kwalifikację prawną operacji.

Znaczenie wzorca twarzy dla anonimizacji twarzy

W systemach anonimizacji materiałów wizualnych najbezpieczniejszy model to taki, który ogranicza się do detekcji obiektów wymagających ukrycia, a nie do biometrycznego rozpoznawania osób. To rozróżnienie jest ważne także organizacyjnie, bo wpływa na zakres danych, retencję i ryzyko naruszeń.

W praktyce należy odróżnić trzy przypadki:

  • detekcja twarzy - system wykrywa, gdzie w kadrze znajduje się twarz, aby ją zamazać, ale nie tworzy trwałego identyfikatora osoby,
  • tracking twarzy - system śledzi ten sam obiekt między klatkami dla stabilnego zamazania; nie musi to jeszcze oznaczać identyfikacji osoby w sensie biometrycznym, ale wymaga ostrożnej oceny technicznej,
  • rozpoznawanie twarzy - system tworzy i porównuje faceprinty, aby ustalić, czy to konkretna osoba lub czy twarz pojawiała się wcześniej.

W rozwiązaniach takich jak Gallio PRO automatyzacja anonimizacji dotyczy twarzy i tablic rejestracyjnych na zdjęciach i nagraniach zapisanych, a nie anonimizacji strumienia wideo. Z perspektywy compliance istotne jest ograniczenie przetwarzania do celu zamazania i niewytwarzanie zbędnych danych biometrycznych. Dodatkowo oprogramowanie nie powinno zbierać logów zawierających dane osobowe lub dane szczególnych kategorii, chyba że jest to niezbędne i odpowiednio uzasadnione, co wspiera zasadę minimalizacji danych z art. 5 ust. 1 lit. c RODO.

Kluczowe parametry i metryki face template

Ocena systemu wykorzystującego wzorce twarzy nie może opierać się wyłącznie na deklaracji producenta. Potrzebne są mierzalne parametry, najlepiej raportowane według uznanych metod testowych. W środowisku regulacyjnym szczególne znaczenie ma relacja między skutecznością a ryzykiem błędnej identyfikacji.

Parametr

Znaczenie

Typowa interpretacja

 

FAR - False Accept Rate

Odsetek błędnych dopasowań osób różnych

Niższy FAR zmniejsza ryzyko fałszywej identyfikacji

FRR - False Reject Rate

Odsetek błędnych odrzuceń tej samej osoby

Niższy FRR zwiększa użyteczność systemu

EER - Equal Error Rate

Punkt, w którym FAR = FRR

Im niższy EER, tym lepsza równowaga modelu

TAR przy określonym FAR

Skuteczność poprawnego dopasowania przy zadanym poziomie błędnych akceptacji

Metryka częsta w testach biometrycznych

Latency

Czas ekstrakcji i porównania wzorca

W przetwarzaniu wsadowym wpływa na czas obsługi partii materiałów

Template size

Rozmiar wzorca w bajtach lub liczbie wymiarów

Wpływa na pamięć, transfer i retencję danych

W standardach biometrycznych istotne są także pojęcia presentation attack detection i quality score, bo słaba jakość wejścia obniża wiarygodność porównań. Dla administratora wideo ma to znaczenie dowodowe i audytowe. Wynik modelu zależy od jakości nagrania, kompresji, kąta twarzy, okluzji i oświetlenia.

Odniesienia normatywne i standardy

Przy opisie wzorca twarzy warto odwołać się do aktów prawnych i standardów technicznych, które porządkują terminologię oraz sposób oceny systemów. Nie wszystkie regulują anonimizację bezpośrednio, ale wyznaczają ramy dla biometrii i przetwarzania obrazu twarzy.

  • RODO - rozporządzenie (UE) 2016/679, w szczególności art. 4 pkt 14, art. 5, art. 9, art. 25 i art. 35,
  • ISO/IEC 2382-37:2022 - terminologia biometryczna,
  • ISO/IEC 19795-1:2021 - Biometric performance testing and reporting - Part 1: Principles and framework,
  • ISO/IEC 30107-1:2023 oraz ISO/IEC 30107-3:2023 - ramy i testowanie odporności na presentation attacks,
  • ISO/IEC 39794-5:2019 - format wymiany danych biometrycznych twarzy,
  • NIST Face Recognition Vendor Test - bieżący program testowy oceniający dokładność algorytmów rozpoznawania twarzy w scenariuszach 1:1 i 1:N.

Trzeba zaznaczyć rozbieżność interpretacyjną spotykaną w praktyce. Część operacji technicznych na twarzy może być kwalifikowana jako zwykłe przetwarzanie obrazu, jeżeli nie prowadzi do identyfikacji osoby. Gdy jednak powstaje i jest używany face template do rozróżniania lub potwierdzania tożsamości, dominujące podejście regulacyjne prowadzi do uznania takiego zestawu danych za dane biometryczne.

Ryzyka i dobre praktyki dla administratorów materiałów wideo

Wzorzec twarzy jest danymi o wysokiej wrażliwości operacyjnej. W odróżnieniu od hasła nie da się go skutecznie "zmienić" po wycieku. Dlatego decyzja o jego tworzeniu powinna być poprzedzona oceną, czy ten element jest w ogóle niezbędny do celu przetwarzania.

W praktyce rekomendowane są następujące działania:

  • unikać tworzenia i przechowywania faceprintów, jeśli celem jest wyłącznie zamazanie twarzy na zdjęciu lub nagraniu,
  • ograniczać retencję danych pośrednich i usuwać tymczasowe artefakty analityczne,
  • dokumentować architekturę modelu, progi dopasowania i zakres danych wejściowych,
  • testować skuteczność detekcji i poziom błędów na danych zbliżonych do rzeczywistego środowiska pracy,
  • oddzielać funkcje anonimizacji od funkcji identyfikacyjnych, jeżeli organizacja korzysta z obu klas narzędzi,
  • stosować kontrolę dostępu, szyfrowanie i rozliczalność operacji administracyjnych.

W kontekście zdjęć i wideo publikowanych lub udostępnianych osobom trzecim celem zwykle jest ograniczenie identyfikowalności osób. Z tego punktu widzenia face template jest pojęciem granicznym. Może wspierać rozpoznawanie twarzy, ale nie jest konieczny do samego zamazywania twarzy. Dla zgodności z zasadą minimalizacji danych bezpieczniejszy jest model, w którym system wykrywa obszar twarzy i nakłada maskę, bez budowania trwałego wzorca biometrycznego osoby.