Czym jest batch video processing?

Batch video processing - definicja

Batch video processing, czyli masowe przetwarzanie plików wideo, to sposób organizacji pracy systemu, w którym wiele nagrań jest przetwarzanych automatycznie jako zbiór zadań, a nie pojedynczo i nie w trybie strumieniowym. W kontekście anonimizacji zdjęć i nagrań oznacza to uruchamianie sekwencji operacji na dużych wolumenach plików, zwykle archiwalnych, według z góry zdefiniowanego pipeline'u. Każdy plik przechodzi te same etapy: ingest, walidację formatu, dekodowanie, ekstrakcję klatek lub analizę klatka po klatce, detekcję obiektów podlegających ochronie, śledzenie obiektów w czasie, nałożenie maski lub rozmycia, ponowne kodowanie, kontrolę jakości i zapis wyniku.

W praktyce technicznej batch processing przeciwstawia się przetwarzaniu real-time. System nie musi spełniać wymagań niskiego opóźnienia, ale musi zapewnić przewidywalną przepustowość, odporność na błędy oraz możliwość wznowienia zadań. W przypadku anonimizacji wideo najczęściej chodzi o automatyczne wykrywanie i zamazywanie twarzy oraz tablic rejestracyjnych na dużej liczbie materiałów. Takie podejście jest standardowe w archiwach monitoringu, materiałach dowodowych, zbiorach audytowych, repozytoriach medialnych i procesach publikacji materiałów po anonimizacji.

W systemach takich jak Gallio PRO batch video processing dotyczy przetwarzania plików zapisanych na dysku lub w repozytorium. Nie oznacza anonimizacji strumienia wideo ani działania w czasie rzeczywistym. Automatyczna detekcja obejmuje twarze i tablice rejestracyjne. Inne elementy, takie jak dokumenty, treść monitorów, tatuaże, logotypy czy identyfikatory imienne, mogą wymagać pracy manualnej w edytorze, jeśli system nie oferuje dla nich automatycznej detekcji.

Rola batch video processing w anonimizacji dużych zbiorów nagrań

W projektach anonimizacji archiwów najtrudniejsze nie jest samo rozmycie pojedynczej twarzy, lecz powtarzalne przetworzenie tysięcy godzin materiału z kontrolą jakości i pełną rozliczalnością procesu. Batch video processing rozwiązuje ten problem przez podział pracy na odseparowane etapy i automatyzację wykonania.

Dla Inspektora Ochrony Danych ważne jest to, że pipeline wsadowy pozwala ustalić jednolite reguły przetwarzania dla całego zbioru. Ogranicza to ryzyko przypadkowego pominięcia części plików lub stosowania różnych ustawień anonimizacji w podobnych sprawach.

  • Skalowalność - system może przetwarzać tysiące plików przez kolejkę zadań i wielu workerów.
  • Powtarzalność - ten sam model detekcji, te same progi i polityki maskowania dla całej partii.
  • Odporność - błędny plik nie zatrzymuje całego procesu, a zadanie można ponowić.
  • Audytowalność - możliwe jest przypisanie wyniku do wersji modelu, parametrów i czasu wykonania.
  • Separacja środowisk - łatwiej utrzymać przetwarzanie on-premise bez przekazywania nagrań do usług publicznych.

Jak zorganizować pipeline anonimizacji wsadowej

Pipeline powinien być projektowany jako ciąg etapów, które można monitorować i restartować. W praktyce najlepiej sprawdza się architektura kolejkowa z niezależnymi workerami CPU i GPU. Dekodowanie, inferencja modeli i kodowanie końcowe mają różne profile obciążenia, dlatego nie powinny być łączone w jednym nierozróżnialnym procesie.

Dla dużych archiwów warto zachować nie tylko plik wynikowy, ale także metadane techniczne potrzebne do rozliczenia procesu. Nie należy jednak tworzyć logów zawierających dane osobowe lub zrzuty detekcji. Gallio PRO nie powinno zbierać logów zawierających detekcję twarzy i tablic rejestracyjnych ani innych logów z danymi osobowymi.

Etap

Opis techniczny

Cel

 

Ingest

Import plików, checksum, identyfikacja kodeka i kontenera

Weryfikacja kompletności i zgodności wejścia

Dekodowanie

Odczyt strumienia wideo do klatek lub segmentów GOP

Przygotowanie danych dla analizy

Detekcja

Model deep learning wykrywa twarze i tablice rejestracyjne

Ustalenie obszarów do anonimizacji

Tracking

Łączenie detekcji między klatkami

Stabilne maskowanie w czasie

Maskowanie

Blur, pixelation lub pełne zasłonięcie obszaru

Ograniczenie identyfikowalności

Re-encoding

Ponowne kodowanie wynikowego materiału

Uzyskanie pliku gotowego do użycia

QA

Kontrola automatyczna i próbka manualna

Ocena skuteczności i błędów

Technologie stosowane w batch video processing

Automatyczna anonimizacja twarzy i tablic rejestracyjnych opiera się zwykle na modelach głębokiego uczenia. Deep learning jest wykorzystywany do budowy modelu AI, który następnie wykonuje detekcję obiektów na klatkach obrazu. W praktyce stosuje się architektury detekcyjne CNN lub ich nowsze odpowiedniki, trenowane na oznaczonych zbiorach danych. Sam model nie wystarcza. Do poprawnej pracy potrzebne są jeszcze algorytmy śledzenia obiektów, mechanizmy interpolacji brakujących detekcji i kontrola jakości maski.

Po stronie infrastruktury typowy stos technologiczny obejmuje akcelerację GPU dla inferencji, kolejki zadań, magazyn plików, bazę metadanych technicznych oraz moduł orkiestracji. Dla środowisk o podwyższonych wymaganiach bezpieczeństwa preferowane jest wdrożenie on-premise.

Kluczowe parametry i metryki batch video processing

Ocena pipeline'u wsadowego nie może opierać się wyłącznie na czasie wykonania. W anonimizacji liczy się zarówno skuteczność wykrycia, jak i stabilność działania oraz koszt przetworzenia jednej godziny materiału. Parametry należy mierzyć osobno dla twarzy i osobno dla tablic rejestracyjnych, ponieważ mają inny rozmiar obiektu, inne warunki oświetlenia i inną dynamikę błędów.

  • Przepustowość - liczba minut lub godzin materiału przetwarzanych na godzinę pracy systemu.
  • Latency zadania - czas od dodania pliku do kolejki do uzyskania wyniku.
  • Recall - odsetek rzeczywistych twarzy lub tablic wykrytych przez system.
  • Precision - odsetek poprawnych detekcji wśród wszystkich detekcji systemu.
  • Frame miss rate - udział klatek, w których obiekt obecny nie został zamazany.
  • Tracking continuity - spójność maskowania w kolejnych klatkach.
  • Failure rate - odsetek plików zakończonych błędem technicznym.
  • Bitrate output - docelowa przepływność po rekodowaniu, wpływająca na jakość i rozmiar pliku.

W prostym ujęciu przepustowość można zapisać jako: Throughput = łączny czas materiału wejściowego / całkowity czas przetwarzania. Dla planowania zasobów przydatna jest też relacja GPU-hours / 100h materiału.

Wyzwania i ograniczenia batch video processing

W materiale archiwalnym występują duże różnice jakości. Stare kodeki, niski bitrate, przeplot, rozdzielczość SD, nagrania nocne i silna kompresja obniżają jakość detekcji. To samo dotyczy ujęć z dużym ruchem kamery, zasłonięciami i małymi obiektami w tle. W takich warunkach konieczne są konserwatywne progi i kontrola manualna próbek.

W praktyce należy też rozdzielić kwestie techniczne od prawnych. Twarz może stanowić daną osobową w materiale wizualnym, jeśli umożliwia identyfikację osoby. Obowiązek jej anonimizacji wynika z kontekstu przetwarzania, w tym z RODO, ochrony dóbr osobistych oraz zasad rozpowszechniania wizerunku. W przypadku tablic rejestracyjnych sytuacja w Polsce bywa oceniana niejednolicie. Występują stanowiska wskazujące na potrzebę ich zamazywania, ale istnieje także linia orzecznicza sądów administracyjnych uznająca, że same tablice nie zawsze stanowią dane osobowe. W wielu państwach Europy Zachodniej praktyka ochronna jest zwykle bardziej rygorystyczna.

Odniesienia normatywne i źródła dla batch video processing

Batch video processing jako termin techniczny nie jest zdefiniowany w jednej normie branżowej dla anonimizacji wideo. Jego znaczenie wynika z utrwalonego użycia w informatyce przetwarzania wsadowego oraz z praktyki systemów computer vision. Dla oceny zgodności i bezpieczeństwa należy odwoływać się do aktów prawnych i norm opisujących przetwarzanie danych, zarządzanie bezpieczeństwem i ocenę systemów AI.

  • Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 - RODO, 2016.
  • ISO/IEC 27001:2022 - wymagania dla systemu zarządzania bezpieczeństwem informacji, ISO/IEC, 2022.
  • ISO/IEC 23894:2023 - zarządzanie ryzykiem związanym ze sztuczną inteligencją, ISO/IEC, 2023.
  • NIST AI RMF 1.0 - Artificial Intelligence Risk Management Framework, NIST, 2023.
  • ISO/IEC 22989:2022 - pojęcia i terminologia AI, ISO/IEC, 2022.
  • ETSI EN 303 645 V2.1.1, 2020 - dobre praktyki bezpieczeństwa dla urządzeń połączonych, przydatne przy pracy z materiałem z kamer IoT.

Jeżeli organizacja wdraża pipeline on-premise, warto dodatkowo dokumentować: wersję modelu detekcji, zakres zbioru wejściowego, poziom próbkowania kontroli jakości, procedurę obsługi błędów oraz zasady retencji plików źródłowych i wynikowych.