Kandydat zostaje odrzucony. Wniosek o premię specjalną zostaje odrzucony. Zaszeregowanie wypada niżej, niż oczekiwano. W każdym z tych trzech przypadków brał udział agent AI - i w każdym z nich osoba, której to dotyczy, będzie mogła wkrótce wypowiedzieć słowa zarezerwowane dotąd dla prawników: “Proszę wyjaśnić mi rolę systemu AI i najważniejsze elementy tej decyzji.”
To nie jest scenariusz hipotetyczny. To dosłowny rdzeń artykułu 86 Rozporządzenia (UE) 2024/1689 - najbardziej niedocenianego artykułu EU AI Act. Branża dyskutuje o dokumentacji modeli, klasach ryzyka i terminach. Artykuł 86 stawia inne pytanie: Czy potrafisz wyjaśnić jedną konkretną decyzję? Nie swój system. Tę jedną decyzję.
Większość firm nie potrafi. Nie dlatego, że ich AI jest słaba - lecz dlatego, że ich architektura dokumentuje niewłaściwą jednostkę. Protokołują rozmowy, tokeny i zachowanie systemu. Podważalne jest jednak tylko to, co zostało utrwalone jako decyzja. Ten artykuł opisuje brakujący artefakt: akt decyzyjny.
W skrócie - Akt decyzyjny
- Podważyć można tylko to, co zostało utrwalone jako decyzja. Akt decyzyjny to atomowy, niezmienny dowód pojedynczej mikrodecyzji: input, zastosowana reguła fachowa z wersją i źródłem, wynik, pewność, wersja modelu, znacznik czasu, ścieżka podważenia. Logi odpowiadają na "Co się stało?" - akt decyzyjny odpowiada na "Dlaczego zdecydowano w ten sposób?".
- Art. 86 EU AI Act daje osobie prawo do wyjaśnienia pojedynczej decyzji - a TSUE już dziś wymaga takiego samego uzasadnienia pojedynczego przypadku na gruncie RODO. Opis systemu nie wystarczy.
- Logi czatu, trace observability i karty modelu dokumentują interakcję, infrastrukturę i system - ale nie uzasadnienie merytoryczne. Własna dokumentacja Microsoftu potwierdza: log audytowy Copilota nie rejestruje ani treści promptów, ani wersji modelu. A teksty rozumowania modeli językowych - według badań Anthropic - tylko w jednej czwartej przypadków oddają faktyczną podstawę decyzji.
- Agent AI nigdy nie podejmuje "jednej decyzji" - na jedną sprawę podejmuje dziesiątki mikrodecyzji. Każda z nich może być prawnie istotna: TSUE traktuje już zautomatyzowany scoring jako decyzję, a nie dopiero wynik końcowy.
- Podważalności nie da się dobudować po fakcie: decyzja, która nigdy nie została zamodelowana jako decyzja, nie może zostać uzasadniona później. Dlatego akt decyzyjny jest zasadą architektoniczną Decision Layer - nie funkcją compliance.
Agentyczna AI oznacza: przeniesienie praw decyzyjnych
Dane wielkich firm doradczych układają się w 2026 roku w spójny obraz. McKinsey nazywa to paradoksem gen AI: prawie osiem na dziesięć firm stosuje generatywną AI, a niemal równie duży odsetek nie odnotowuje mierzalnego przełożenia na wynik finansowy - ponieważ horyzontalne asystenty wdraża się szeroko, podczas gdy wartościotwórcze, wertykalne przypadki użycia grzęzną na etapie pilotażu. Gartner prognozuje, że ponad 40 procent projektów agentycznej AI zostanie zaniechanych do końca 2027 roku - wyraźnie również z powodu niewystarczających kontroli ryzyka. Ta sama prognoza zakłada, że do 2028 roku co najmniej 15 procent codziennych decyzji w pracy będzie podejmowanych autonomicznie przez agentów AI.
Oba stwierdzenia razem ujawniają zasadnicze napięcie: firmy przenoszą prawa decyzyjne na maszyny, nie dysponując infrastrukturą, która pozwala za te decyzje odpowiadać. Dokładnie tak McKinsey opisuje erę agentyczną w swoim badaniu zaufania z 2026 roku - pytanie przewodnie przesuwa się z “Czy model jest dokładny?” na “Kto odpowiada, gdy system działa?” (State of AI trust in 2026).
Luka governance jest skwantyfikowana we wszystkich źródłach:
| Ustalenie | Liczba | Źródło |
|---|---|---|
| Projekty agentycznej AI zaniechane do końca 2027 - m.in. z powodu niewystarczających kontroli ryzyka | ponad 40% | Gartner, 2025 |
| Przedsiębiorstwa z dojrzałym governance dla autonomicznych agentów | tylko 21% | Deloitte, 2025 |
| Kadra kierownicza ds. technologii, której adopcja AI już wyprzedziła własną zdolność governance | 77% | IBM IBV, 2026 |
| CIO/CTO pociągani do odpowiedzialności za systemy AI, których nie kontrolują w pełni | około dwie trzecie | IBM IBV, 2026 |
| Zgłoszone incydenty AI w 2024 - rekordowy poziom, +56,4% rok do roku | 233 | Stanford HAI AI Index, 2025 |
| Mniej incydentów AI, gdy governance jest wbudowane bezpośrednio w system, zamiast nadzoru ręcznego | 25% | IBM IBV, 2026 |
Ostatni wiersz jest najważniejszy: wbudowane governance działa mierzalnie lepiej niż kontrola następcza. Dokładnie w tym miejscu pytanie staje się konkretne - co “wbudowane” oznacza technicznie. Odpowiedź Najostrzej widać to w HR: przekazanie agentom prawa do decydowania zmienia model operacyjny - a każda z tych decyzji dotyka konkretnej osoby: jej zwolnienia lekarskiego, jej wynagrodzenia, jej zaszeregowania. zaczyna się od prawa.
Czego wymaga artykuł 86 - i dlaczego dokumentacja systemu tego nie spełnia
EU AI Act zna dwa zasadniczo różne poziomy przejrzystości, które w dyskusji o compliance są nieustannie mylone:
| Poziom | Podstawa prawna | Adresat | Moment | Odpowiada na pytanie |
|---|---|---|---|---|
| Przejrzystość systemu | Art. 11 (dokumentacja techniczna), art. 13 (instrukcja obsługi dla podmiotu stosującego) | organ, podmiot stosujący | przed uruchomieniem | ”Jak działa system w ogóle?” |
| Wyjaśnienie pojedynczego przypadku | Art. 86 AI Act, art. 15 ust. 1 lit. h i art. 22 RODO | osoba, której dotyczy | po decyzji | ”Dlaczego ta jedna decyzja wypadła w ten sposób?” |
Artykuł 86 daje każdej osobie, która podlega decyzji opartej na systemie AI wysokiego ryzyka z Załącznika III i jest przez nią dotknięta prawnie lub w podobnie istotny sposób, roszczenie wobec podmiotu stosującego: do jasnych i merytorycznych wyjaśnień dotyczących roli systemu AI w procedurze podejmowania decyzji oraz głównych elementów podjętej decyzji. To sformułowanie odnoszące się do przypadku, nie do systemu. Karta modelu opisuje model. Artykuł 86 pyta o przypadek.
Trybunał Sprawiedliwości UE wyłożył tę samą zasadę dla RODO już wcześniej - w dwóch wyrokach, które powinien znać każdy, kto odpowiada za decyzje AI:
SCHUFA, C-634/21 (grudzień 2023): Już zautomatyzowane utworzenie wartości scoringowej jest zautomatyzowaną decyzją w indywidualnym przypadku w rozumieniu art. 22 RODO, gdy tylko podmiot trzeci przypisuje jej rozstrzygające znaczenie. Konsekwencja sięga daleko poza scoring zdolności kredytowej: obowiązek prześledzenia odnosi się do samej oceny maszynowej - nie dopiero do następczej decyzji końcowej, którą podpisuje człowiek.
Dun & Bradstreet Austria, C-203/22 (luty 2025): Administrator musi wyjaśnić faktycznie zastosowaną procedurę tak, by osoba mogła prześledzić, które z jej danych w jaki sposób wpłynęły na decyzję. Wyjaśnienie kontrfaktyczne może wystarczyć - na przykład: przy jakiej zmianie danych wejściowych wynik wypadłby inaczej? Oraz: tajemnice handlowe nie uzasadniają blankietowej odmowy; w razie konfliktu informacje należy ujawnić właściwemu organowi lub sądowi, które wówczas dokonają wyważenia.
Wyjaśnienie kontrfaktyczne dla pojedynczego przypadku wymaga, by dla każdej decyzji faktycznie użyte dane wejściowe oraz zastosowana reguła były zapisane w ustrukturyzowanej formie. Z ogólnego opisu systemu nie da się tego odtworzyć.
Do tego dochodzi pointa, która w dyskusji o compliance regularnie umyka: art. 12 zobowiązuje systemy wysokiego ryzyka do automatycznej rejestracji przez cały okres eksploatacji, a art. 26 ust. 6 zobowiązuje podmioty stosujące do przechowywania tych logów co najmniej sześć miesięcy. Jakie treści mają zawierać logi, ustawa definiuje jednak tylko dla systemów biometrycznych. Dla systemów HR i finansowych AI Act nakazuje zdolność rejestracji - schemat treści pozostawia jednak otwarty. To, co zostaje utrwalone przy każdej decyzji, jest zadaniem projektowym podmiotu stosującego. Kto rejestruje tu tylko zużycie tokenów i znaczniki czasu, spełnia literę art. 12, ale nie sprosta art. 86.
Dla uporządkowania terminów: zgodnie z obowiązującym prawem obowiązki wysokiego ryzyka mają zastosowanie od 2 sierpnia 2026 r., a wstępnie uzgodnione w Digital Omnibus z 7 maja 2026 r. przesunięcie tego terminu na 2 grudnia 2027 r. nie zostało jeszcze formalnie przyjęte. Nie zmienia to klasyfikacji procesów HR jako wysokiego ryzyka (Załącznik III nr 4) ani cywilnoprawnego obowiązku wyjaśnialności, który obowiązuje na całym świecie już od dawna. Szczegóły terminów i obowiązków omawia EU AI Act 2026: status, terminy, potrzeba działania.
”Decyzja AI” nie istnieje - istnieją dziesiątki mikrodecyzji
Kto traktuje artykuł 86 operacyjnie poważnie, natychmiast napotyka problem granularności: Czym dokładnie jest “ta decyzja”?
Ta dekompozycja nie jest związana z żadną jurysdykcją. Decyzja kredytowa rozkłada się według tej samej mechaniki: weryfikacja tożsamości (zestaw reguł), ekstrakcja dochodu z dokumentów (AI, z wartością pewności), wyliczenie scoringu (zestaw reguł, wersjonowany), routing progowy (zestaw reguł), głos człowieka w przypadku granicznym (człowiek). Które prawo wiąże pojedynczą mikrodecyzję - RODO art. 22, UK GDPR, LGPD art. 20 czy amerykański Equal Credit Opportunity Act - zależy od rynku. Sama dekompozycja jest wszędzie taka sama. Jak głęboko sięga w regulowanym procesie, pokazuje przykład, którym europejskie działy HR zajmują się codziennie:
Przetworzyć zwolnienie lekarskie - to brzmi jak jeden proces. W rzeczywistości kryje się w nim kilkanaście pojedynczych decyzji: Czy elektroniczne zwolnienie e-ZLA zostało poprawnie pobrane z profilu płatnika w PUE ZUS (eZUS) do systemu kadrowo-płacowego? Czy przysługuje wynagrodzenie chorobowe wg art. 92 Kodeksu pracy - i w jakiej wysokości (80 czy 100 procent)? Czy chodzi o zwykłą chorobę, czy o niezdolność przypadającą na okres ciąży albo powstałą wskutek wypadku w drodze do pracy lub z pracy (art. 92 § 1 pkt 2 KP), gdzie obowiązuje 100 procent? Czy wyczerpano roczny limit 33 dni (lub 14 dni dla pracowników 50+), po którym następuje przejście na zasiłek chorobowy ZUS z ustawy zasiłkowej (ustawa z 25.06.1999 r. o świadczeniach pieniężnych z ubezpieczenia społecznego w razie choroby i macierzyństwa)? Czy osiągnięto próg 182 dni nieprzerwanej niezdolności, który uruchamia orzecznictwo lekarskie ZUS? Kto zostaje o czym poinformowany - i o czym wyraźnie nie, by nie ujawnić danych zdrowotnych z RODO art. 9?
Decision Layer rozkłada każdy proces biznesowy dokładnie na te mikrodecyzje i z góry przypisuje każdą z nich jednemu z trzech typów decydentów - człowiek, zestaw reguł lub AI:
| Mikrodecyzja (zwolnienie lekarskie) | Decydent | Dlaczego |
|---|---|---|
| Pobranie e-ZLA z profilu płatnika w PUE ZUS (eZUS) | Zestaw reguł | deterministyczne, brak miejsca na interpretację |
| Wyliczenie wynagrodzenia chorobowego wg art. 92 KP (80 / 100%) | Zestaw reguł | stałe wyliczenie limitu i kwoty z podstawy 12 miesięcy |
| Routing do zasiłku chorobowego ZUS po wyczerpaniu 33 / 14 dni | Zestaw reguł | deterministyczna reguła limitu rocznego |
| Wykrycie progu 182 / 270 dni i routing do orzecznictwa ZUS | Zestaw reguł | ustawowy próg długoterminowej niezdolności |
| Statystyczne oznaczenie nietypowych wzorców nieobecności | AI (wskaźnik) | wykrywanie anomalii, wynik jest sygnałem do przeglądu, nie decyzją kadrową |
| Rozmowa o powrocie do pracy i adaptacji stanowiska | Człowiek | relacja zaufania, ocena uznaniowa |
| Rozwiązanie umowy z powodu choroby (art. 53 KP) | Człowiek | przesłanki art. 53 KP, odwrócony ciężar dowodu wg art. 18³ᵇ § 1 Kodeksu pracy |
To rozłożenie nie jest ćwiczeniem akademickim - jest warunkiem podważalności. Bo logika SCHUFA z TSUE obowiązuje na każdym poziomie: skoro już zautomatyzowany scoring jest decyzją w sensie prawnym, to także maszynowe sprawdzenie terminu, maszynowa klasyfikacja dokumentu, maszynowa rekomendacja zaszeregowania jest każdorazowo potencjalnie podważalnym aktem - nie dopiero wynik końcowy. Firma, która dokumentuje tylko wynik końcowy, na pytanie “Dlaczego mój wniosek został odrzucony?” może odpowiedzieć jedynie: “Tak wyszło z procesu.” To dokładnie ta odpowiedź czarnej skrzynki, której nie akceptuje żaden sąd pracy.
Jak głęboko sięga ten podział w praktyce, pokazuje katalog agentów HR: każdy agent z pełną tabelą mikrodecyzji - dla każdego kroku typ decydenta, uzasadnienie, podstawa prawna i ścieżka podważenia.
Dlaczego logi, trace i karty modelu nie odpowiadają na to pytanie
Branża odpowiedziała na potrzebę dokumentacji - ale na trzech poziomach, które wszystkie omijają pojedynczą decyzję:
| Poziom | Narzędzia | Dokumentuje | NIE odpowiada na |
|---|---|---|---|
| Interakcja | Logi czatu, historia konwersacji, zdarzenia audytowe Copilota | kto kiedy rozmawiał z systemem, jakie zasoby zostały dotknięte | która reguła fachowa była podstawą decyzji |
| Infrastruktura | Observability LLM (trace, spany), OpenTelemetry GenAI | prompty, wywołania narzędzi, tokeny, opóźnienia wzdłuż wykonania | dlaczego wynik wypadł merytorycznie tak - i czy jest poprawny |
| System | Karty modelu, dokumentacja techniczna, platformy governance (inwentarz modeli, rejestr ryzyk) | jak model działa ogólnie, jakie ryzyka ma system | jakikolwiek konkretny pojedynczy przypadek |
To nie retoryczna przesada - tak wynika z dokumentacji producentów. Dokumentacja Purview Microsoftu podaje dla logu audytowego Copilota, że nie rejestruje on faktycznych promptów i odpowiedzi, a nazwa i wersja modelu nie są dostępne w scenariuszach Microsoft 365 Copilot. W ekosystemie Salesforce luka nazwana jest wprost: klasyczne ślady audytowe zbudowano dla ludzi klikających przyciski - widać, że coś się zmieniło, ale nie dlaczego. A platformy governance jak IBM watsonx.governance czy Credo AI odpowiadają na pytanie “Czy ten system jest zinwentaryzowany, oceniony pod kątem ryzyka i zgodny z politykami?” - ważne pytanie, ale inne niż “Na czym opierało się zaszeregowanie pani M. 14 maja o 10:42?”.
Pozostaje pozornie najbliższe wyjście: po prostu pozwolić, by model sam uzasadnił własną decyzję. Modele rozumujące generują łańcuchy uzasadnień - czemu nie zarchiwizować ich jako dowodu? Bo - jak pokazują badania - nie oddają wiernie tego, na czym decyzja faktycznie się opierała. Badania Anthropic nad wiernością łańcucha rozumowania pokazują: nawet w sprzyjających warunkach modele rozumujące ujawniają faktycznie użyte czynniki decyzyjne tylko w około jednej czwartej przypadków - istotne czynniki wpływu pozostają ukryte nawet wtedy, gdy czyta się kompletny łańcuch uzasadnienia. Wygenerowane uzasadnienie to tekst o decyzji. Nie jest podstawą decyzji.
Badania nad podważalnością wyciągają z tego rozstrzygający wniosek: wyjaśnialność i podważalność to dwa środki do tego samego celu - samo wyjaśnienie, bez ścieżki podważenia, tego celu nie osiąga (Schmude i in., 2025). Podważalność liczy się z tym, że decyzja może być błędna, i wymaga dowodów, by ją obalić. Metody wyjaśniania post-hoc pokazują w najlepszym razie, że gdzieś w sąsiedztwie decyzji mogą leżeć błędy; dowodu, że ta jedna decyzja była wadliwa, nie dostarczają. A Moreira i in. (2025) przesuwają miarę z samego zrozumienia na zdolność działania: wyjaśnienie musi umożliwić osobom i kontrolerom aktywne zakwestionowanie, podważenie i wpłynięcie na wynik - nie tylko prześledzenie, dlaczego tak zdecydowano.
Z trace tokenów nikt tego nie zrobi. Z aktem decyzyjnym - tak.
Akt decyzyjny: dowód na każdą decyzję
Akt decyzyjny to atomowy, niezmienny, ustrukturyzowany dowód pojedynczej merytorycznej mikrodecyzji. Powstaje w momencie decyzji - nie jako następcza rekonstrukcja - i zawiera wszystko, czego art. 86, art. 12 i orzecznictwo TSUE wymagają dla pojedynczego przypadku:
| Pole | Treść | Czemu służy prawnie |
|---|---|---|
| Input | jakie dane, jaki dokument, jaki hash | C-203/22: “które dane w jaki sposób wpłynęły” |
| Reguła fachowa + wersja + źródło | np. regulamin premiowania § 12 ust. 3, wersja 2024-Q3, obowiązuje od 01.07.2024 | uzasadnienie, które się obroni - pole, którego nie mają logi ani trace |
| Typ decydenta | człowiek, zestaw reguł lub AI - z uzasadnieniem routingu | art. 14: dowód skutecznego nadzoru ludzkiego |
| Pewność | wartość pewności i próg w momencie decyzji | dowód zarządzania ryzykiem (art. 9), prześledzenie eskalacji |
| Wersja modelu i promptu | który model językowy, który szablon promptu, która wersja | odtwarzalność; pole brakujące w logu audytowym Copilota |
| Wynik + znacznik czasu | co zostało zdecydowane, kiedy (UTC) | przechowywanie wg art. 26 ust. 6, niezmienność wpisu wg ustawy o rachunkowości |
| Adnotacja Human-in-the-Loop | kto sprawdził, czy zatwierdził, czy odstąpił | art. 14 ust. 4: pominięcie, unieważnienie lub odwrócenie wyniku, przerwanie działania systemu - udokumentowane |
| Ścieżka podważenia | kto może podważyć tę decyzję i gdzie | roszczenie z art. 86 możliwe do spełnienia w praktyce |
Tak wygląda akt rzeczywistej sprawy - cztery z 13 mikrodecyzji przetwarzania zwolnienia lekarskiego:
Wpływ e-ZLA 14.05.2026, godz. 07:12. Sprawa przetworzona w 54 sekundy - rozłożona na 13 udokumentowanych mikrodecyzji.
-
02Wyliczenie wynagrodzenia chorobowego wg art. 92 KP Reguła
80% podstawy od 14.05.2026
input: okres e-ZLA 14-27.05 · dane kadrowe EMP_0x52a8rule: art. 92 KP · v2026-01 -
06Kontrola progu 182 dni zasiłkowych Reguła
Limit niewyczerpany - kontynuacja wynagrodzenia chorobowego
input: historia absencji, 12 miesięcy (3 okresy)rule: ustawa zasiłkowa z 25.06.1999 · v2025-07 -
09Oznaczenie wzorca absencji AI 91%
Sygnał dla HR: trzecia krótka absencja w ciągu sześciu miesięcy
input: zanonimizowane metadane absencji - bez diagnozy (RODO art. 9)model-reason: dopasowanie wzorca powtarzających się krótkich absencji · wskaźnik, nie decyzja kadrowaformalnie podważalna · art. 14 EU AI Act -
13Rozmowa o powrocie do pracy Człowiek
Uzgodniony plan powrotu po długotrwałej nieobecności
decided-by: specjalistka HR - 17.05.2026, 14:10
Polskie prawo administracyjne ma dla tego artefaktu precyzyjną analogię: akt administracyjny - decyzję administracyjną w rozumieniu Kodeksu postępowania administracyjnego. Organ, który rozstrzyga o obywatelu, nie wydaje “outputu” - wydaje akt: indywidualnie adresowany, uzasadniony, z podstawą prawną i pouczeniem o środkach odwoławczych, pojedynczo zaskarżalny. Nikt nie zaakceptowałby, by urząd odpowiadał na odwołanie: “Niestety mamy tylko log serwera.” Dokładnie ten wymóg formy akt decyzyjny przenosi na decyzje maszynowe. Trail to ślad, który się zostawia. Akt to dokument, który się wydaje - i od którego przysługuje odwołanie.
Tę samą logikę rachunkowość zna od stuleci: żaden biegły rewident nie zaakceptuje sumy bez zapisów księgowych i dowodów źródłowych. Ustawa o rachunkowości wymaga zapisu pojedynczego, niezmienności i możliwości prześledzenia każdej operacji gospodarczej - z okresami przechowywania ksiąg i dowodów księgowych przez 5 lat wg art. 74 ustawy o rachunkowości oraz dokumentacji podatkowej do upływu przedawnienia zobowiązania, czyli znacznie dłużej niż sześć miesięcy z art. 26 ust. 6. Akt decyzyjny to nic innego niż podwójna księgowość dla decyzji: jeden dowód na operację, jeden akt na decyzję.
O tym, że ta jednostka nie ma jeszcze ustalonej nazwy, najlepiej świadczy sam rynek: krążą “decision trail”, “decision provenance”, “decision trace”, “accountability record” - TechTarget ogłasza ścieżki decyzyjne AI nowym śladem audytowym, FINOS AI Governance Framework żąda “Agent Decision Audit and Explainability”. Wymaganie dotarło do dyskursu. Artefakt wciąż nie ma nazwy. My nazywamy go od początku w Decision Layer: akt decyzyjny.
Gdzie powstaje akt, widać na siedmiu warstwach produkcyjnego stosu agentowego - akt decyzyjny jest artefaktem warstwy 04:
-
01
Presentation Layer
Interfejsy użytkownika, bramki promptów, portale dostępowe dla działów i rady pracowników.
-
02
Orchestration Layer
Koordynacja wielu agentów, routing zdarzeń, zarządzanie stanem ponad granicami procesów.
-
03
Agent Layer rdzeń Gosign
Agenci Document, Workflow i Knowledge - warstwa wykonawcza z osądem AI.
-
04
Decision Layer rdzeń Gosign
Tu powstaje akt decyzyjny: jeden akt na mikrodecyzję, wersjonowane zestawy reguł, routing human-in-the-loop przy uznaniowości, podważalność wg art. 14.
-
05
Governance Layer
Audit trail, podpisane rekordy, kontrole cert-ready dla EU AI Act art. 9/12/13/14, ISO 27001.
-
06
Model Layer
Rejestr modeli, wersjonowanie, kalibracja pewności - niezależnie od modelu.
-
07
Integration Layer
Konektory do SAP, Workday, systemów ERP - wyniki gotowe do zaksięgowania.
Podważalność to decyzja architektoniczna - nie funkcja
Niewygodna konsekwencja tego wszystkiego: podważalności nie da się dobudować po fakcie. Trzy powody, dla których następcze narzędzie compliance strukturalnie zawodzi:
Po pierwsze: czego nigdy nie zamodelowano jako decyzji, nie da się jako decyzji uzasadnić. Agent, który przetwarza sprawę “za jednym zamachem”, produkuje wynik bez struktury. Podział na mikrodecyzje musi nastąpić przed wykonaniem - to on definiuje, w których miejscach powstaje akt, która reguła tam obowiązuje i kto tam decyduje. Po fakcie nie da się wyodrębnić struktury decyzyjnej z logu konwersacji, tak samo jak z wyciągu bankowego nie da się wyprowadzić rachunku kosztów.
Po drugie: skuteczny nadzór ludzki potrzebuje kontekstu decyzji - dla każdej sprawy. Art. 14 ust. 4 wymaga, by osoba nadzorująca mogła poprawnie zinterpretować wynik, zignorować go, unieważnić lub odwrócić oraz przerwać działanie systemu - i pozostawała świadoma skłonności do automatycznego polegania na wyniku maszyny. Ustawodawca wprost nazywa to automation bias. Amerykański NIST ostrzega w tym samym duchu przed ceremonialnym Human-in-the-Loop: przycisk zatwierdzenia bez kontekstu, uprawnień i czasu nikogo nie chroni. Osoba, która ma odwrócić decyzję, musi mieć przed sobą dane wejściowe, zastosowaną regułę, pewność i powód eskalacji - czyli dokładnie pola aktu decyzyjnego. Dlatego Human-in-the-Loop w Decision Layer to wymuszony routing, a nie opcjonalne kliknięcie: przy zdefiniowanych typach decyzji workflow się zatrzymuje, system docelowy pozostaje nietknięty, a sama decyzja człowieka jest dokumentowana jako akt - łącznie z informacją, czy poszedł za rekomendacją, czy od niej odstąpił.
Po trzecie: korekta potrzebuje odniesienia do reguły. Podważenie nie jest celem samym w sobie - ma usuwać błędy. Gdy decyzja zostaje skutecznie podważona, natychmiast pojawia się pytanie: czy to był błąd jednostkowy, czy błąd reguły? Akt decyzyjny, który zawiera zastosowaną wersję reguły, odpowiada na to jednym zapytaniem: wszystkie akty oparte na tej samej wersji reguły są identyfikowalne, reguła zostaje skorygowana w nowej wersji, a objęte nią sprawy są punktowo rozstrzygane ponownie. W ten sposób podważenie jednego przypadku prowadzi do wyeliminowania całej klasy błędów. Bez odniesienia do reguły pozostaje tylko ręczny przegląd wszystkich spraw - przeciwieństwo skalowania.
Badania nazywają tę zasadę Contestability by Design (Alfrink i in., 2022): systemy muszą przez cały cykl życia pozostawać otwarte na interwencję człowieka - jako proceduralna relacja między osobami dotkniętymi decyzją a odpowiedzialnymi za system, wbudowana, a nie dobudowana. A Deloitte (2025) nazywa trzy elementy governance, których przedsiębiorstwom brakuje dla agentów, niemal słowo w słowo zgodnie z tą architekturą: jasne granice, które decyzje agenci mogą podejmować samodzielnie, a które wymagają ludzkiego zatwierdzenia; monitoring w czasie rzeczywistym z wykrywaniem anomalii; oraz ślady audytowe, które utrwalają pełny łańcuch działań agenta na potrzeby rozliczalności. Framework trzech typów decyzji, Confidence Routing i akt decyzyjny są techniczną odpowiedzią dokładnie na tę listę - jako zasada projektowa, a nie jako następcza warstwa compliance.
Kto podważa - i co dzieje się potem
Podważalność brzmi abstrakcyjnie, ma jednak cztery bardzo konkretne oblicza. Decision Layer definiuje dla każdej mikrodecyzji, przed kim musi się ona obronić:
| Kto podważa | Podstawa prawna | Co widzi | Co z tego wynika |
|---|---|---|---|
| Osoba, której dotyczy | Art. 86 AI Act, art. 15, 22 RODO | wyjaśnienie własnej decyzji: rola systemu AI, istotne elementy, na żądanie kontrfaktyczne | korekta pojedynczego przypadku; przy błędzie reguły ponowne rozstrzygnięcie wszystkich dotkniętych spraw |
| Rada pracowników / związki zawodowe | ustawa z 7 kwietnia 2006 r. o informowaniu pracowników i przeprowadzaniu z nimi konsultacji, art. 28 ustawy o związkach zawodowych (obowiązek informacyjny pracodawcy) | akty decyzji istotnych kadrowo, dowód technicznego egzekwowania reguł porozumienia | informacja i konsultacja oparte na dowodach, a nie na nieufności |
| Biegły rewident | ustawa o rachunkowości, Krajowe Standardy Badania, ISA | kompletne akty na każdy zapis: dowód, reguła, wersja, pewność, zatwierdzenie | badanie systemu zamiast odtwarzania pojedynczych przypadków; próba wprost udowodniona |
| Organ nadzoru | Art. 26 ust. 6, art. 12 AI Act; nadzór rynku (UODO dla RODO, PIP dla prawa pracy) | eksportowalne, maszynowo czytelne logi za wymagany okres przechowywania | zdolność udzielenia informacji w ciągu dni zamiast projektu forensycznego |
Godne uwagi jest to, co ta tabela robi z organizacją: odwraca rozkład ciężaru dowodu. Bez aktów decyzyjnych każde podważenie to projekt forensyczny o otwartym wyniku - a wg art. 18³ᵇ § 1 Kodeksu pracy (a poza stosunkiem pracy art. 14 ustawy z 3.12.2010 r.) w przypadku dyskryminacji pracownik jedynie uprawdopodabnia nierówne traktowanie, a ciężar dowodu spoczywa na pracodawcy. Z aktami decyzyjnymi odpowiedź sprowadza się do zapytania. Rada pracowników, która dziś odnosi się do projektów AI z nieufnością i eskaluje brak rzetelnych informacji, staje się beneficjentem tej samej infrastruktury, z której korzysta audytor. Inni obiecują przejrzystość. Akt decyzyjny wymusza ją technicznie.
Ta tabela ma cichą drugą stronę: kto może podważyć, regulują ustawa i porozumienia - ale żadna norma sama z siebie nie zapewnia, że akty decyzyjne w ogóle powstają, są kompletne i trwałe. Ta odpowiedzialność potrzebuje jednoznacznego właściciela w organizacji; nie powstaje jako produkt uboczny bieżącej działalności.
Uporządkowanie: zasada toruje sobie drogę
Uczciwe spojrzenie na rynek 2026: wniosek, że decyzje agentów muszą dać się pojedynczo udowodnić, nie jest odosobniony. Gartner stworzył z Guardian Agents własną kategorię rynkową dla warstw kontroli, które monitorują i blokują działania agentów, i prognozuje im do 2030 r. 10-15 procent rynku agentycznej AI. Pole decision intelligence - jawne modelowanie, ocenianie i ulepszanie decyzji - dostało w styczniu 2026 swój pierwszy Magic Quadrant. WEF żąda progresywnego governance: intensywność nadzoru sprzężona ze stopniem autonomii agenta. Badania pracują nad decision provenance. Kierunek jest jednoznaczny - i jest dokładnie kierunkiem Decision Layer.
Te podejścia nie zapewniają jednak powiązania z warstwą merytoryczną. Guardian Agent blokuje w czasie wykonania; nie zostawia aktu, który trzy lata później obroni się przed sądem pracy. Observability zachowuje łańcuch wykonania; nie rozkłada decyzji na pojedynczo uzasadnione, związane regułą artefakty. Decydująca różnica aktu decyzyjnego leży w trzech właściwościach: w przypisaniu każdej mikrodecyzji do wersjonowanej reguły fachowej wraz z jej źródłem - zakładowy układ zbiorowy pracy, regulamin wynagradzania, prawo podatkowe - zamiast do wygenerowanego łańcucha uzasadnienia; w architektonicznie wymuszonym Human-in-the-Loop dla każdego typu decyzji zamiast wyłączalnej konfiguracji; oraz w odwzorowaniu aktów na standardy badania, z którymi biegli rewidenci i audyt wewnętrzny faktycznie pracują - ISA, Krajowe Standardy Badania, ustawa o rachunkowości. Pierwszego z tych pól, wedle naszej wiedzy, nie dokumentuje żaden dostawca horyzontalny; a to właśnie pole, od którego zależy podważalność.
Dla precyzji trzeba też dokonać rozgraniczenia: akt decyzyjny to wypowiedź architektoniczna, nie certyfikat zgodności. To, czy konkretny system spełnia wymagania prawne, pozostaje oceną pojedynczego przypadku dokonaną przez podmiot stosujący i jego doradców prawnych. To, co dostarcza architektura, jest czymś innym - i cenniejszym: czyni wymagania spełnialnymi. Firma z aktami decyzyjnymi potrafi odpowiedzieć na pytanie z art. 86. Firma z logami czatu nie potrafi, niezależnie od tego, jak dobrze udokumentowane są jej intencje.
Właściwe pytanie
EU AI Act nie wymyślił wyjaśnialności pojedynczych decyzji - skodyfikował ją dla systemów AI i wzmocnił prawem osoby, której decyzja dotyczy. Orzecznictwo TSUE wyznaczyło miarę, zanim w ogóle zaczął obowiązywać pierwszy termin wysokiego ryzyka. A firmy doradcze skwantyfikowały, co się dzieje, gdy firmy przenoszą prawa decyzyjne, nie potrafiąc udowodnić decyzji: zaniechane projekty, zablokowane wdrożenia, osobiście odpowiadający CIO.
Pytanie do każdej firmy, która stosuje lub wprowadza agentów AI, nie brzmi więc “Czy jesteśmy compliant?”. Brzmi: Jeśli jutro pracownik, rada pracowników, biegły rewident lub organ podważy jedną pojedynczą dzisiejszą decyzję - czy potrafisz przedłożyć akt? Input, reguła, wersja, pewność, wynik, zatwierdzenie?
Kto potrafi odpowiedzieć na to pytanie “tak”, nie ma już problemu z ryzykiem AI. Ma infrastrukturę decyzyjną.
→ Decision Layer - przegląd i przykłady
→ Decision Layer - wyjaśnienie dla osób odpowiedzialnych za procesy
→ EU AI Act: AI w HR pozostaje wysokiego ryzyka - termin 2026/2027
Umów spotkanie - Pokażemy na jednym z Twoich procesów, jak konkretnie wyglądają mikrodecyzje, akty decyzyjne i ścieżki podważenia.

Bert Gogolin
Dyrektor Generalny, Gosign
AI Governance Briefing
Enterprise AI, regulacje i infrastruktura - raz w miesiącu, bezpośrednio ode mnie.