Przekazywanie dokumentów zawierających dane osobowe do zewnętrznych modeli językowych (ChatGPT, Claude, Gemini, Copilot) stało się w ostatnich dwóch latach codziennością w wielu kancelariach, działach HR i organach administracji. Pytanie, na które odpowiedzi nie ma wprost w żadnym przepisie: czy to jest zgodne z RODO?
Co to jest „przetwarzanie" w rozumieniu RODO
Art. 4 pkt 2 RODO definiuje przetwarzanie bardzo szeroko: każda operacja wykonywana na danych osobowych (zbieranie, utrwalanie, udostępnianie, przesyłanie), nawet jednorazowa i automatyczna. Wklejenie treści pisma z nazwiskiem i adresem klienta do okna czatu AI jest przetwarzaniem. Nie ma znaczenia, czy użytkownik robi to świadomie, czy „tylko na szybko".
Trzy scenariusze w praktyce
Scenariusz A, pełne ujawnienie
Dokument trafia do modelu AI w oryginalnej postaci, z danymi osób fizycznych. Dostawca modelu zostaje procesorem danych w rozumieniu RODO. Wymaga to umowy powierzenia, weryfikacji lokalizacji serwerów (UE vs kraj trzeci), oceny zabezpieczeń i zgód klientów, których dane są przetwarzane.
W praktyce: dla większości kancelarii i urzędów, niewykonalne. Zwłaszcza przy bezpłatnych lub konsumenckich wersjach narzędzi.
Scenariusz B, anonimizacja przed wysłaniem
Dokument zostaje zanonimizowany przed opuszczeniem organizacji. Do modelu AI trafia tekst, w którym nazwiska, adresy, PESEL zostały zastąpione tokenami. Dane osobowe nie opuszczają komputera.
Zgodnie z motywem 26 RODO: dane zanonimizowane (nieidentyfikowalne) nie są już danymi osobowymi. RODO ich nie obejmuje. Taki tekst można swobodnie analizować narzędziami zewnętrznymi.
Kluczowy warunek: anonimizacja musi być nieodwracalna z perspektywy zewnętrznego odbiorcy. Jeżeli klucz mapowania tokenów pozostaje u nadawcy, a do modelu trafia tylko tekst z tokenami, warunek jest spełniony.
Scenariusz C, pseudonimizacja z mapą po stronie dostawcy
Niektóre rozwiązania oferują „anonimizację w chmurze", dokument jest wysyłany do serwera dostawcy, tam tokenizowany, a następnie przekazywany do modelu AI. To nadal przetwarzanie danych osobowych, tylko z dodatkowym pośrednikiem. Ryzyko prawne nie znika, przesuwa się.
Rekomendacja
Dla działów, które muszą jednocześnie korzystać z asystentów AI i pozostać w zgodzie z RODO, jedyna praktyczna ścieżka to scenariusz B: anonimizacja wykonywana lokalnie, przed wysłaniem czegokolwiek na zewnątrz.
Wybierając narzędzie, sprawdź:
- czy przetwarzanie odbywa się w 100% offline (bez żadnego ruchu sieciowego z treścią dokumentu);
- czy mapa tokenów jest przechowywana wyłącznie lokalnie (na komputerze użytkownika);
- czy narzędzie generuje raport anonimizacji, który można włączyć do dokumentacji RODO;
- czy można zweryfikować brak telemetrii treści (np. przez analizę ruchu sieciowego).
Beznazwisk.pl, anonimizacja w 100% offline
Aplikacja przetwarza dokumenty lokalnie na Twoim komputerze. Żaden fragment treści nie trafia do chmury. Mapa tokenów zostaje u Ciebie. Spełnia scenariusz B zgodny z RODO.
Pobierz bezpłatnieCo dalej
Urząd Ochrony Danych Osobowych w kolejnych stanowiskach z 2024 i 2025 r. podkreślał, że odpowiedzialność za zgodność z RODO spoczywa na administratorze, niezależnie od tego, jakiego narzędzia używa. Argument „ale tak robią wszyscy" nie jest obroną w postępowaniu.
Jeśli pracujesz z dokumentami zawierającymi dane osobowe i korzystasz z asystentów AI, dziś, nie jutro, warto przejść na model anonimizacji offline. Techniczny koszt jest marginalny. Ryzyko prawne braku takiego kroku, rosnące.
Autor: Zespół Beznazwisk.pl. Tekst ma charakter informacyjny i nie stanowi porady prawnej.