Czym jest Automated Facial Recognition (AFR)?

Automated Facial Recognition (AFR) - definicja

Automated Facial Recognition (AFR) to zautomatyzowane rozpoznawanie twarzy, czyli zestaw metod informatycznych służących do wykrywania twarzy w obrazie, wyodrębniania ich cech oraz porównywania tych cech z innymi obrazami lub wzorcami zapisanymi w bazie. W praktyce AFR obejmuje co najmniej trzy odrębne etapy: detekcję twarzy, ekstrakcję cech i dopasowanie. W literaturze technicznej oraz dokumentach regulacyjnych rozróżnia się też zadania pokrewne, takie jak weryfikacja 1:1, identyfikacja 1:N, klasyfikacja atrybutów twarzy oraz kategoryzacja obrazów zawierających twarze.

W kontekście anonimizacji zdjęć i nagrań wideo AFR ma znaczenie pośrednie, ale istotne. Aby automatycznie zamazywać twarze, system musi najpierw wykryć ich położenie w pojedynczej klatce albo w sekwencji wideo. Do tego zwykle stosuje się modele uczenia maszynowego, najczęściej deep learning. Taki model nie musi wykonywać pełnego rozpoznawania tożsamości, ale korzysta z podobnych podstaw technicznych jak AFR, zwłaszcza w warstwie detekcji i lokalizacji twarzy. Z tego powodu podmioty wdrażające automatyczne rozmywanie twarzy powinny odróżniać zwykłe wykrywanie obiektów od rozpoznawania biometrycznego prowadzącego do identyfikacji osoby.

Z perspektywy prawa unijnego twarz może stanowić źródło danych biometrycznych, jeżeli jest przetwarzana specjalnymi środkami technicznymi w celu jednoznacznej identyfikacji osoby fizycznej. Taki kierunek wynika z art. 4 pkt 14 RODO, czyli rozporządzenia (UE) 2016/679. Nie każde użycie algorytmu do wykrycia twarzy oznacza więc automatycznie przetwarzanie szczególnej kategorii danych. Kluczowy jest cel i sposób użycia danych. Jeżeli system służy wyłącznie do wykrycia twarzy i jej zamazania bez identyfikacji, ocena prawna może być inna niż w przypadku identyfikacji 1:N w bazie referencyjnej.

Jak działa AFR w przetwarzaniu zdjęć i wideo

W systemach używanych do anonimizacji materiałów wizualnych AFR należy rozumieć przede wszystkim jako rodzinę technik analizy obrazu opartych na modelach uczonych na dużych zbiorach danych. W nowoczesnych rozwiązaniach dominują sieci konwolucyjne oraz architektury detekcyjne i embeddingowe. To one umożliwiają wykrycie twarzy w różnych warunkach oświetlenia, skali, kąta ustawienia głowy i częściowego zasłonięcia.

Typowy przepływ przetwarzania wygląda następująco:

  • detekcja twarzy - model lokalizuje twarz i wyznacza ramkę ograniczającą lub punkty charakterystyczne,
  • śledzenie międzyklatkowe - w wideo system łączy detekcje tej samej twarzy pomiędzy kolejnymi klatkami,
  • normalizacja obrazu - twarz może być prostowana lub skalowana przed dalszą analizą,
  • ekstrakcja cech - model wyznacza reprezentację numeryczną twarzy, zwaną embeddingiem,
  • dopasowanie - embedding porównuje się z innymi embeddingami przy użyciu miar odległości, np. cosinusowej lub euklidesowej,
  • decyzja - system uznaje zgodność albo brak zgodności przy określonym progu.

W narzędziach do anonimizacji, takich jak oprogramowanie klasy on-premise do przetwarzania zdjęć i nagrań, wymagany jest zwykle tylko pierwszy i częściowo drugi etap. Samo zamazywanie twarzy nie wymaga identyfikacji konkretnej osoby. Właśnie ta różnica ma znaczenie dla zgodności z zasadą minimalizacji danych z art. 5 ust. 1 lit. c RODO.

AFR a anonimizacja twarzy

Automatyczne rozmywanie twarzy nie jest tym samym co AFR rozumiane jako identyfikacja biometryczna. Jednak technologicznie oba obszary są ze sobą powiązane. Model AI używany do zamazywania twarzy musi nauczyć się, czym jest twarz i gdzie znajduje się ona w kadrze. Najczęściej oznacza to trenowanie lub wykorzystanie wcześniej wytrenowanego modelu deep learning na oznaczonych zbiorach obrazów.

W praktyce należy odróżnić trzy poziomy przetwarzania:

  • detekcja twarzy - system znajduje twarz, ale nie ustala tożsamości,
  • analiza twarzy - system może oceniać atrybuty lub podobieństwo,
  • rozpoznawanie twarzy - system podejmuje próbę identyfikacji lub weryfikacji osoby.

Dla podmiotów zajmujących się anonimizacją zdjęć i wideo ten podział jest praktyczny. Jeżeli celem jest ochrona prywatności przez zamazanie twarzy, nie ma potrzeby wdrażania funkcji identyfikacyjnych. Ograniczenie przetwarzania do detekcji i śledzenia zwykle zmniejsza ryzyko prawne i operacyjne.

Kluczowe parametry i metryki AFR

Ocena systemu AFR wymaga użycia mierzalnych wskaźników. Ich dobór zależy od zadania. W identyfikacji i weryfikacji stosuje się inne metryki niż przy detekcji twarzy na potrzeby zamazywania.

Obszar

Metryka

Znaczenie praktyczne

 

Detekcja

Precision, Recall, mAP

Określa, jak często system poprawnie wykrywa twarze i jak często generuje fałszywe alarmy

Weryfikacja 1:1

FMR, FNMR, EER

Pokazuje kompromis między błędnym dopuszczeniem i błędnym odrzuceniem

Identyfikacja 1:N

Rank-1, Recall@K

Mierzy, czy właściwa osoba znajduje się wśród najlepszych dopasowań

Wydajność

Latency, throughput

Istotne przy przetwarzaniu dużych kolekcji zdjęć i nagrań

Śledzenie wideo

ID switch, track continuity

Wpływa na stabilność maskowania twarzy między klatkami

W badaniach porównawczych często odwołuje się do testów NIST Face Recognition Technology Evaluation, prowadzonych przez National Institute of Standards and Technology. NIST publikuje cykliczne raporty porównujące algorytmy m.in. pod kątem false match rate i false non-match rate w różnych scenariuszach. Są to ważne źródła referencyjne dla oceny jakości algorytmów, choć wyniki zależą od zbioru testowego i warunków badania.

Regulacje prawne - RODO i EU AI Act

Ocena legalności AFR w Unii Europejskiej wymaga równoległego odniesienia do RODO oraz AI Act. Są to akty o różnym zakresie. RODO reguluje przetwarzanie danych osobowych, a AI Act ustanawia wymogi dla systemów AI ze względu na poziom ryzyka.

W kontekście RODO najważniejsze są następujące elementy:

  • art. 4 pkt 14 RODO - definicja danych biometrycznych,
  • art. 9 ust. 1 RODO - co do zasady zakaz przetwarzania szczególnych kategorii danych, z wyjątkami z art. 9 ust. 2,
  • art. 5 RODO - zasady legalności, minimalizacji, ograniczenia celu i integralności,
  • art. 25 RODO - privacy by design i privacy by default,
  • art. 35 RODO - ocena skutków dla ochrony danych, gdy przetwarzanie może powodować wysokie ryzyko.

AI Act, czyli rozporządzenie Parlamentu Europejskiego i Rady (UE) 2024/1689 z 13 czerwca 2024 r., wprowadza szczegółowe reguły dla systemów AI, w tym dla niektórych zastosowań biometrycznych. W obszarze rozpoznawania twarzy istotne jest rozróżnienie między zdalną identyfikacją biometryczną, kategoryzacją biometryczną i rozpoznawaniem emocji. Część zastosowań jest zakazana, część zaliczona do systemów wysokiego ryzyka, a część podlega obowiązkom transparentności lub ogólnym wymogom bezpieczeństwa. Konkretna kwalifikacja zależy od scenariusza użycia, użytkownika i celu.

Obowiązki podmiotów korzystających z AFR

Organizacja stosująca AFR do analizy zdjęć lub nagrań musi wykazać, że cel, zakres i środki techniczne są proporcjonalne. W praktyce compliance oznacza nie tylko podstawę prawną, ale też architekturę systemu ograniczającą zbędne przetwarzanie.

Najczęściej wymagane działania obejmują:

  • ustalenie, czy dochodzi do przetwarzania danych biometrycznych w rozumieniu RODO,
  • określenie celu - np. detekcja do zamazania twarzy albo identyfikacja osoby,
  • przeprowadzenie DPIA, jeżeli ryzyko dla praw i wolności osób jest wysokie,
  • wdrożenie kontroli dostępu, szyfrowania i retencji danych,
  • udokumentowanie źródeł danych treningowych i testowych oraz ograniczeń modelu,
  • monitorowanie jakości modelu, w tym błędów i driftu danych,
  • ograniczenie logów do informacji niezbędnych operacyjnie, bez zapisywania danych osobowych, jeżeli nie jest to konieczne.

W środowisku anonimizacji materiałów wizualnych praktyczne znaczenie ma wdrażanie rozwiązań on-premise. Taki model może ograniczyć transfer danych do zewnętrznych podmiotów i ułatwić spełnienie wymogów bezpieczeństwa informacji, choć sam w sobie nie przesądza o zgodności z prawem.

Wyzwania i ograniczenia AFR

AFR nie jest technologią bezbłędną. Jakość rozpoznawania zależy od rozdzielczości obrazu, kąta ustawienia twarzy, zasłonięcia, kompresji, oświetlenia i jakości zbioru treningowego. W nagraniach wideo dodatkowym problemem jest rozmycie ruchu i niestabilność śledzenia obiektu.

Ryzyka praktyczne są następujące:

  • fałszywe dopasowania i fałszywe odrzucenia,
  • nierównomierna skuteczność dla różnych grup demograficznych, opisywana m.in. w raportach NIST i badaniach akademickich,
  • trudność interpretacji wyników przez użytkowników nietechnicznych,
  • nadmierne rozszerzanie celu przetwarzania, czyli function creep,
  • ryzyko użycia detekcji twarzy jako etapu wstępnego do identyfikacji bez właściwej podstawy prawnej.

Dlatego w zastosowaniach związanych z ochroną prywatności zalecane jest podejście minimalne - wykrycie twarzy, jej zamazanie i brak funkcji identyfikacyjnych, jeżeli nie są one niezbędne.

Odniesienia normatywne i źródła

Poniższe akty i dokumenty stanowią podstawę do oceny AFR w kontekście zdjęć i nagrań wideo:

  • Rozporządzenie (UE) 2016/679 (RODO), 27 kwietnia 2016 r.
  • Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2024/1689 (AI Act), 13 czerwca 2024 r.
  • NIST Face Recognition Technology Evaluation - raporty porównawcze publikowane cyklicznie przez National Institute of Standards and Technology
  • ISO/IEC 19794-5 - Information technology - Biometric data interchange formats - Face image data
  • ISO/IEC 30107-3 - Information technology - Biometric presentation attack detection - Part 3: Testing and reporting
  • Wytyczne Europejskiej Rady Ochrony Danych dotyczące przetwarzania danych biometrycznych i oceny ryzyka, w zakresie właściwym dla danego zastosowania