Ein Bewerber wird abgelehnt. Eine Sonderzahlung wird verweigert. Eine Eingruppierung fällt niedriger aus als erwartet. In allen drei Fällen war ein KI-Agent beteiligt - und in allen drei Fällen kann der Betroffene künftig einen Satz sagen, der bisher Anwälten vorbehalten war: “Erläutern Sie mir die Rolle des KI-Systems und die wichtigsten Elemente dieser Entscheidung.”

Das ist kein hypothetisches Szenario. Es ist der Wortlaut-Kern von Artikel 86 der KI-Verordnung (EU) 2024/1689 - dem am meisten unterschätzten Artikel des EU AI Act. Die Branche diskutiert über Modell-Dokumentation, Risikoklassen und Fristen. Artikel 86 stellt eine andere Frage: Können Sie eine einzelne, konkrete Entscheidung erklären? Nicht Ihr System. Diese eine Entscheidung.

Die meisten Unternehmen können es nicht. Nicht, weil ihre KI schlecht wäre - sondern weil ihre Architektur die falsche Einheit dokumentiert. Sie protokollieren Konversationen, Token und Systemverhalten. Anfechtbar ist aber nur, was als Entscheidung festgehalten wurde. Dieser Artikel beschreibt das fehlende Artefakt: den Entscheidungsakt.

Auf einen Blick - Der Entscheidungsakt

  • Anfechtbar ist nur, was als Entscheidung festgehalten wurde. Der Entscheidungsakt ist der atomare, unveränderliche Nachweis einer einzelnen Mikroentscheidung: Input, angewandte Fachregel samt Version und Quelle, Ergebnis, Konfidenz, Modellversion, Zeitstempel, Anfechtungspfad. Logs beantworten "Was geschah?" - der Entscheidungsakt beantwortet "Warum wurde so entschieden?".
  • Art. 86 EU AI Act gibt Betroffenen ein Recht auf Erläuterung der einzelnen Entscheidung - und der EuGH verlangt dieselbe Einzelfall-Begründung schon heute unter der DSGVO. Eine Systembeschreibung genügt nicht.
  • Chat-Logs, Observability-Traces und Model Cards dokumentieren Interaktion, Infrastruktur und System - aber nicht die fachliche Begründung. Microsofts eigene Dokumentation bestätigt: Das Copilot-Audit-Log erfasst weder Prompt-Inhalte noch die Modellversion. Und Reasoning-Texte von Sprachmodellen geben laut Anthropic-Forschung nur in einem Viertel der Fälle die tatsächliche Entscheidungsgrundlage wieder.
  • Ein KI-Agent trifft nie "eine Entscheidung" - er trifft Dutzende Mikroentscheidungen pro Vorgang. Jede einzelne kann rechtlich relevant sein: Der EuGH wertet schon den automatisierten Score als Entscheidung, nicht erst das Endergebnis.
  • Anfechtbarkeit lässt sich nicht nachrüsten: Eine Entscheidung, die nie als Entscheidung modelliert wurde, kann nachträglich nicht begründet werden. Deshalb ist der Entscheidungsakt ein Architekturprinzip des Decision Layer - keine Compliance-Funktion.

Agentische KI heißt: Entscheidungsrechte übertragen

Die Zahlen der großen Beratungshäuser erzählen 2026 eine konsistente Geschichte. McKinsey nennt es das Gen-AI-Paradox: Fast acht von zehn Unternehmen setzen generative KI ein, ein fast ebenso großer Anteil sieht keinen messbaren Ergebniseffekt - weil horizontale Assistenten breit ausgerollt werden, die wertschöpfenden vertikalen Anwendungsfälle aber im Pilotstatus stecken bleiben. Gartner prognostiziert, dass über 40 Prozent der Agentic-AI-Projekte bis Ende 2027 abgebrochen werden - ausdrücklich auch wegen unzureichender Risikokontrollen. Dieselbe Prognose erwartet, dass bis 2028 mindestens 15 Prozent der täglichen Arbeitsentscheidungen autonom von KI-Agenten getroffen werden.

Beide Aussagen zusammen ergeben das eigentliche Spannungsfeld: Unternehmen übertragen Entscheidungsrechte an Maschinen, ohne die Infrastruktur zu besitzen, diese Entscheidungen zu verantworten. McKinsey rahmt die agentische Ära in seiner Trust-Studie 2026 genau so - die Leitfrage verschiebe sich von “Ist das Modell genau?” zu “Wer haftet, wenn das System handelt?” (State of AI trust in 2026).

Die Governance-Lücke ist über alle Quellen hinweg quantifiziert:

BefundZahlQuelle
Agentic-AI-Projekte, die bis Ende 2027 abgebrochen werden - u.a. wegen unzureichender Risikokontrollenüber 40%Gartner, 2025
Unternehmen mit reifer Governance für autonome Agentennur 21%Deloitte, 2025
Technologie-Führungskräfte, deren KI-Adoption die eigene Governance-Fähigkeit bereits überholt77%IBM IBV, 2026
CIOs/CTOs, die für KI-Systeme verantwortlich gemacht werden, die sie nicht vollständig kontrollierenrund zwei DrittelIBM IBV, 2026
Gemeldete KI-Vorfälle 2024 - Rekordhoch, +56,4% gegenüber Vorjahr233Stanford HAI AI Index, 2025
Weniger KI-Vorfälle bei Governance, die direkt ins System eingebettet ist, statt manueller Aufsicht25%IBM IBV, 2026

Die letzte Zeile ist die wichtigste: Eingebettete Governance wirkt messbar besser als nachgelagerte Kontrolle. Genau an dieser Stelle wird die Frage konkret, was “eingebettet” technisch bedeutet. Und sie stellt sich am schärfsten in HR: Wer Entscheidungsrechte an Agenten überträgt, verschiebt sein Operating Model - und jede dieser Entscheidungen trifft eine konkrete Person, ihre Krankmeldung, ihre Vergütung, ihre Einstufung. Die Antwort beginnt beim Gesetz.

Was Artikel 86 verlangt - und warum Systemdokumentation es nicht erfüllt

Der EU AI Act kennt zwei grundverschiedene Transparenz-Ebenen, die in der Compliance-Diskussion ständig vermischt werden:

EbeneRechtsgrundlageAdressatZeitpunktBeantwortet die Frage
SystemtransparenzArt. 11 (technische Dokumentation), Art. 13 (Betriebsanleitung für Betreiber)Behörde, Betreibervor Inbetriebnahme”Wie funktioniert das System im Allgemeinen?”
Einzelfall-ErläuterungArt. 86 AI Act, Art. 15 Abs. 1 lit. h und Art. 22 DSGVOdie betroffene Personnach der Entscheidung”Warum fiel diese eine Entscheidung so aus?”

Artikel 86 gibt jeder Person, die einer Entscheidung auf Basis eines Hochrisiko-KI-Systems nach Anhang III unterliegt und dadurch rechtlich oder ähnlich erheblich betroffen ist, einen Anspruch gegen den Betreiber: auf klare und aussagekräftige Erläuterungen zur Rolle des KI-Systems im Entscheidungsverfahren und zu den wichtigsten Elementen der getroffenen Entscheidung. Das ist fallbezogen formuliert, nicht systembezogen. Eine Model Card beschreibt das Modell. Artikel 86 fragt nach dem Fall.

Der Europäische Gerichtshof hat dasselbe Prinzip für die DSGVO bereits ausbuchstabiert - in zwei Urteilen, die jeder kennen sollte, der KI-Entscheidungen verantwortet:

SCHUFA, C-634/21 (Dezember 2023): Schon die automatisierte Erstellung eines Score-Werts ist eine automatisierte Entscheidung im Einzelfall im Sinne von Art. 22 DSGVO, sobald ein Dritter ihr maßgebliche Bedeutung beimisst. Die Konsequenz reicht weit über Bonitäts-Scoring hinaus: Die Nachvollziehbarkeits-Pflicht greift an der maschinellen Bewertung selbst - nicht erst an der nachgelagerten Endentscheidung, die ein Mensch unterschreibt.

Dun & Bradstreet Austria, C-203/22 (Februar 2025): Der Verantwortliche muss das tatsächlich angewandte Verfahren so erläutern, dass die betroffene Person nachvollziehen kann, welche ihrer Daten auf welche Weise in die Entscheidung eingeflossen sind. Eine kontrafaktische Erklärung kann genügen - etwa: Bei welcher Abweichung der Eingangsdaten wäre das Ergebnis anders ausgefallen? Und: Geschäftsgeheimnisse rechtfertigen keine pauschale Verweigerung; im Konfliktfall sind die Informationen der zuständigen Behörde oder dem Gericht offenzulegen, die dann abwägen.

Eine kontrafaktische Erklärung pro Einzelfall setzt voraus, dass die tatsächlich verwendeten Eingangsdaten und die angewandte Regel pro Entscheidung strukturiert vorliegen. Aus einer globalen Systembeschreibung lässt sie sich nicht rekonstruieren.

Dazu kommt eine Pointe, die in der Compliance-Diskussion regelmäßig untergeht: Art. 12 verpflichtet Hochrisiko-Systeme zur automatischen Protokollierung über die gesamte Lebensdauer, und Art. 26 Abs. 6 verpflichtet Betreiber, diese Protokolle mindestens sechs Monate aufzubewahren. Welche Inhalte die Protokolle tragen müssen, definiert das Gesetz aber nur für biometrische Systeme. Für HR- und Finance-Systeme schreibt der AI Act die Protokollierungs-Fähigkeit vor - und lässt das Inhalts-Schema offen. Was pro Entscheidung festgehalten wird, ist eine Designaufgabe des Betreibers. Wer hier nur Token-Verbrauch und Zeitstempel loggt, erfüllt den Buchstaben von Art. 12 und scheitert an Art. 86.

Zur Einordnung der Fristen: Nach geltendem Recht greifen die Hochrisiko-Pflichten ab dem 2. August 2026; die im Digital Omnibus am 7. Mai 2026 vorläufig geeinigte Verschiebung auf den 2. Dezember 2027 ist noch nicht formal verabschiedet. An der Hochrisiko-Einstufung von HR-Prozessen (Anhang III Nr. 4) ändert sie nichts - und an der zivilrechtlichen Erklärbarkeits-Pflicht, die weltweit längst gilt, auch nicht. Die Details zu Fristen und Pflichten behandelt EU AI Act 2026: Status, Fristen, Handlungsbedarf.

Eine “KI-Entscheidung” gibt es nicht - es gibt Dutzende Mikroentscheidungen

Wer Artikel 86 operativ ernst nimmt, stößt sofort auf ein Granularitätsproblem: Was genau ist “die Entscheidung”?

EINE „KI-ENTSCHEIDUNG“
input: Antrag MA-4711
?
Ergebnis: abgelehnt
1 Ergebnis · 0 Begründungen · nicht anfechtbar
13 MIKROENTSCHEIDUNGEN
input: Antrag MA-4711
01 02 03 04 05 06 07 08 09 10 11 12 13
Regel (10) KI (1) Mensch (2)
13 Akte · 13 Begründungen · einzeln anfechtbar

Diese Zerlegung ist nicht an eine Jurisdiktion gebunden. Eine Kreditentscheidung zerfällt nach derselben Mechanik: Identitätsprüfung (Regelwerk), Einkommens-Extraktion aus Belegen (KI, mit Konfidenz), Score-Berechnung (Regelwerk, versioniert), Schwellen-Routing (Regelwerk), Grenzfall-Votum (Mensch). Welches Recht die einzelne Mikroentscheidung bindet - DSGVO Art. 22, UK GDPR, LGPD Art. 20 oder der US-amerikanische Equal Credit Opportunity Act - hängt am Markt. Die Zerlegung selbst ist überall dieselbe. Wie tief sie in einem regulierten Prozess reicht, zeigt das Beispiel, das europäische Personalabteilungen täglich beschäftigt:

Eine Krankmeldung verarbeiten - das klingt nach einem Vorgang. Tatsächlich stecken darin über ein Dutzend einzelner Entscheidungen: Ist die elektronische AU nach §109 SGB IV korrekt abgerufen? Greift die Lohnfortzahlung nach §3 EFZG - und in welcher Höhe nach §4? Liegt eine Wiederholungserkrankung mit Anrechnung nach §3 Abs. 1 Satz 2 EFZG vor? Ist die Sechs-Wochen-Schwelle für die BEM-Einladung nach §167 SGB IX erreicht? Muss die Schwerbehindertenvertretung nach §178 SGB IX beteiligt werden? Wer wird worüber informiert - und worüber ausdrücklich nicht?

Der Decision Layer zerlegt jeden Geschäftsprozess in genau diese Mikroentscheidungen und ordnet jede einzelne vorab einem von drei Entscheider-Typen zu - Mensch, Regelwerk oder KI:

Mikroentscheidung (Krankmeldung)EntscheiderWarum
eAU-Abruf nach §109 SGB IV inkl. SperrfristRegelwerkdeterministisch, kein Interpretationsspielraum
Lohnfortzahlung nach §3, §4 EFZG berechnenRegelwerkfeste Frist- und Betragsrechnung
Anrechnung bei Wiederholungserkrankung prüfenRegelwerkdeterministische 12-Monats-Regel
BEM-Einladung ab sechs Wochen nach §167 SGB IX auslösenRegelwerkgesetzliche Pflicht-Schwelle
Auffällige Krankheitsmuster statistisch markierenKI (Indikator)Anomalie-Erkennung, Ergebnis ist Prüfhinweis, keine Personalentscheidung
BEM-Gespräch führenMenschVertrauensbeziehung, §167-Verfahren
Krankheitsbedingte KündigungMenschKSchG §1-Stufenprüfung, Beweislast-Umkehr nach AGG §22

Diese Zerlegung ist keine akademische Übung - sie ist die Voraussetzung für Anfechtbarkeit. Denn die SCHUFA-Logik des EuGH gilt auf jeder Stufe: Wenn schon ein automatisierter Score eine Entscheidung im Rechtssinn ist, dann ist auch die maschinelle Fristprüfung, die maschinelle Klassifikation eines Dokuments, die maschinelle Eingruppierungs-Empfehlung jeweils ein potenziell anfechtbarer Akt - nicht erst das Endergebnis. Ein Unternehmen, das nur das Endergebnis dokumentiert, kann auf die Frage “Warum wurde mein Antrag abgelehnt?” nur antworten: “Der Prozess hat das ergeben.” Das ist exakt die Blackbox-Antwort, die kein Arbeitsgericht akzeptiert.

Wie tief diese Zerlegung in der Praxis geht, zeigt der HR-Agent-Katalog: 48 Agenten, jeder mit vollständiger Mikroentscheidungs-Tabelle - pro Schritt Entscheider-Typ, Begründung, Rechtsgrundlage und Anfechtungsweg.

Warum Logs, Traces und Model Cards die Frage nicht beantworten

Die Industrie hat auf den Dokumentations-Bedarf geantwortet - aber auf drei Ebenen, die alle an der Einzelentscheidung vorbeigehen:

EbeneWerkzeugeDokumentiertBeantwortet NICHT
InteraktionChat-Logs, Conversation History, Copilot-Audit-Eventswer wann mit dem System sprach, welche Ressourcen berührt wurdenwelche fachliche Regel die Entscheidung trug
InfrastrukturLLM-Observability (Traces, Spans), OpenTelemetry GenAIPrompts, Tool-Aufrufe, Token, Latenzen entlang der Ausführungwarum das Ergebnis fachlich so ausfiel - und ob es korrekt ist
SystemModel Cards, technische Dokumentation, Governance-Plattformen (Model-Inventory, Risk-Register)wie das Modell generell funktioniert, welche Risiken das System hatirgendeinen konkreten Einzelfall

Das ist keine polemische Zuspitzung, sondern steht so in den Hersteller-Dokumentationen. Microsofts Purview-Dokumentation hält für das Copilot-Audit-Log fest, dass es die tatsächlichen Prompts und Antworten nicht aufzeichnet und Modellname wie Modellversion in Microsoft-365-Copilot-Szenarien nicht verfügbar sind. Im Salesforce-Ökosystem wird die Lücke selbst benannt: Klassische Audit-Trails seien für Menschen gebaut, die Buttons klicken - man sehe, dass sich etwas geändert hat, aber nicht warum. Und Governance-Plattformen wie IBM watsonx.governance oder Credo AI beantworten die Frage “Ist dieses System inventarisiert, risikobewertet und richtlinienkonform?” - eine wichtige Frage, aber eine andere als “Worauf beruhte die Eingruppierung von Frau M. am 14. Mai um 10:42 Uhr?”.

Bleibt der scheinbar naheliegendste Ausweg: das Modell einfach selbst begründen lassen. Reasoning-Modelle erzeugen Begründungsketten - warum nicht die als Nachweis archivieren? Weil sie nachweislich nicht zuverlässig wiedergeben, worauf die Entscheidung tatsächlich beruhte. Anthropics Forschung zu Chain-of-Thought-Treue zeigt: Selbst unter günstigen Bedingungen verbalisieren Reasoning-Modelle die tatsächlich genutzten Entscheidungshinweise nur in rund einem Viertel der Fälle - relevante Einflussfaktoren bleiben auch dann verborgen, wenn man die komplette Begründungskette liest. Eine generierte Begründung ist ein Text über die Entscheidung. Sie ist nicht die Entscheidungsgrundlage.

Die Forschung zur Anfechtbarkeit zieht daraus den entscheidenden Schluss: Erklärbarkeit und Anfechtbarkeit sind zwei Mittel zum selben Ziel - und Erklärung allein, ohne Anfechtungsweg, verfehlt es (Schmude et al., 2025). Anfechtbarkeit rechnet damit, dass eine Entscheidung falsch sein kann, und verlangt die Beweismittel, sie zu kippen. Post-hoc-Erklärverfahren zeigen bestenfalls, dass irgendwo in der Nachbarschaft einer Entscheidung Fehler liegen können; den Nachweis, dass diese eine Entscheidung fehlerhaft war, liefern sie nicht. Und Moreira et al. (2025) verschieben den Maßstab von bloßem Verstehen zu Handlungsfähigkeit: Eine Erklärung muss Betroffene und Prüfer in die Lage versetzen, ein Ergebnis aktiv anzufechten, zu hinterfragen und zu beeinflussen - nicht nur nachzuvollziehen, warum so entschieden wurde.

Mit einem Token-Trace kann das niemand. Mit einem Entscheidungsakt schon.

Der Entscheidungsakt: das Beweisstück pro Entscheidung

Der Entscheidungsakt ist der atomare, unveränderliche, strukturierte Nachweis einer einzelnen fachlichen Mikroentscheidung. Er entsteht im Moment der Entscheidung - nicht als nachträgliche Rekonstruktion - und enthält alles, was Art. 86, Art. 12 und die EuGH-Rechtsprechung pro Einzelfall verlangen:

FeldInhaltWozu es rechtlich dient
Inputwelche Daten, welches Dokument, welcher HashC-203/22: “welche Daten flossen auf welche Weise ein”
Fachregel + Version + Quellez.B. Tarifvertrag §12 Abs. 3, Version 2024-Q3, gültig seit 01.07.2024die tragende Begründung - das Feld, das Logs und Traces nicht haben
Entscheider-TypMensch, Regelwerk oder KI - mit Routing-BegründungArt. 14: Nachweis wirksamer menschlicher Aufsicht
KonfidenzKonfidenzwert und Schwellenwert zum EntscheidungszeitpunktBeleg des Risikomanagements (Art. 9), Eskalations-Nachvollzug
Modell- und Prompt-Versionwelches Sprachmodell, welche Prompt-Vorlage, welche VersionReproduzierbarkeit; das Feld, das im Copilot-Audit-Log fehlt
Ergebnis + Zeitstempelwas entschieden wurde, wann (UTC)Aufbewahrung nach Art. 26 Abs. 6, GoBD-Festschreibung
Human-in-the-Loop-Vermerkwer geprüft hat, ob er bestätigt oder abgewichen istArt. 14 Abs. 4: übersteuern, widerrufen, stoppen - dokumentiert
Anfechtungspfadwer diese Entscheidung anfechten kann und woArt. 86-Anspruch operativ erfüllbar gemacht

So sieht das in der Akte eines realen Vorgangs aus - vier von 13 Mikroentscheidungen einer Krankmeldungs-Verarbeitung:

decision-record / krankmeldung / 2026-05-14 / EMP_0x52a8

Eingang eAU 14.05.2026, 07:12 Uhr. Vorgang verarbeitet in 54 Sekunden - zerlegt in 13 dokumentierte Mikroentscheidungen.

10 Regel
1
2 Mensch
  1. 02
    Lohnfortzahlung nach §3, §4 EFZG berechnen Regel

    6 Wochen ab 14.05.2026, 100 % Brutto

    input: eAU-Zeitraum 14.05.-27.05. · Stammdaten EMP_0x52a8
    rule: EFZG-§3+§4 · v2026-01
  2. 06
    BEM-Schwelle prüfen (§167 SGB IX) Regel

    42 AU-Tage in 12 Monaten erreicht - BEM-Einladung ausgelöst

    input: AU-Historie 12 Monate (3 Zeiträume)
    rule: SGB-IX-§167 · v2025-07
  3. 09
    Abwesenheits-Muster markieren KI 91%

    Hinweis an HR-Operations: dritte Kurzzeit-AU in sechs Monaten

    input: anonymisierte AU-Metadaten - ohne Diagnose (DSGVO Art. 9)
    model-reason: Muster-Abgleich Kurzzeit-Folge-AU · Indikator, keine Personalentscheidung
    formal anfechtbar · Art. 14 EU AI Act
  4. 13
    BEM-Gespräch führen Mensch

    Wiedereingliederungsplan vereinbart

    decided-by: BEM-Beauftragte - 17.05.2026, 14:10

Die deutsche Sprache hält für dieses Artefakt eine präzise Analogie bereit: den Verwaltungsakt. Eine Behörde, die über einen Bürger entscheidet, erlässt keinen “Output” - sie erlässt einen Akt: einzeln adressiert, begründet, mit Rechtsgrundlage und Rechtsbehelfsbelehrung, einzeln anfechtbar. Niemand würde akzeptieren, dass ein Amt auf Widerspruch antwortet: “Wir haben leider nur das Server-Log.” Genau diese Form-Anforderung überträgt der Entscheidungsakt auf maschinelle Entscheidungen. Ein Trail ist eine Spur, die man hinterlässt. Ein Akt ist ein Dokument, das man erlässt - und gegen das Widerspruch möglich ist.

Dieselbe Logik kennt das Rechnungswesen seit Jahrhunderten: Kein Wirtschaftsprüfer akzeptiert eine Summe ohne Buchungssätze und Belege. Die GoBD verlangen Einzelaufzeichnung, Unveränderbarkeit und Nachvollziehbarkeit pro Geschäftsvorfall - mit Aufbewahrungsfristen von sechs bzw. zehn Jahren nach §147 AO und §257 HGB, weit über die sechs Monate des Art. 26 Abs. 6 hinaus. Der Entscheidungsakt ist nichts anderes als die doppelte Buchführung für Entscheidungen: ein Beleg pro Geschäftsvorfall, ein Akt pro Entscheidung.

Dass für diese Einheit noch kein Standard-Begriff existiert, zeigt der Markt selbst: Es kursieren “Decision Trail”, “Decision Provenance”, “Decision Trace”, “Accountability Record” - TechTarget erklärt KI-Entscheidungspfade zum neuen Audit-Trail, das FINOS AI Governance Framework fordert “Agent Decision Audit and Explainability”. Die Anforderung ist im Diskurs angekommen. Das Artefakt hat noch keinen Namen. Wir nennen es seit Anbeginn des Decision Layer: Entscheidungsakt.

Wo der Akt in der Architektur entsteht, zeigt der Blick auf die sieben Schichten eines produktiven Agenten-Stacks - der Entscheidungsakt ist das Artefakt der Schicht 04:

  1. 01
    Presentation Layer

    User-Interfaces, Prompt-Gateways, Access-Portale für Fachbereiche und Betriebsrat.

  2. 02
    Orchestration Layer

    Multi-Agent-Koordination, Event-Routing, State-Management über Prozess-Grenzen hinweg.

  3. 03
    Agent Layer Gosign-Kern

    Document-, Workflow- und Knowledge-Agents - die ausführende Schicht mit KI-Urteilsvermögen.

  4. 04
    Decision Layer Gosign-Kern

    Hier entsteht der Entscheidungsakt: ein Akt pro Mikroentscheidung, versionierte Regelwerke, Human-in-the-Loop-Routing bei Ermessen, Anfechtbarkeit nach Art. 14.

  5. 05
    Governance Layer

    Audit-Trail, signierte Records, Cert-Ready Controls für EU AI Act Art. 9/12/13/14, ISO 27001, IDW PS 951, GoBD.

  6. 06
    Model Layer

    Model-Registry, Versionierung, Confidence-Calibration - modellagnostisch.

  7. 07
    Integration Layer

    Konnektoren zu SAP, DATEV, Workday - buchungsfertige Outputs in die Zielsysteme.

Anfechtbarkeit ist eine Architekturentscheidung - keine Funktion

Die unbequeme Konsequenz aus alledem: Anfechtbarkeit lässt sich nicht nachrüsten. Drei Gründe, warum ein nachträgliches Compliance-Werkzeug strukturell scheitert:

Erstens: Was nie als Entscheidung modelliert wurde, kann nicht als Entscheidung begründet werden. Ein Agent, der einen Vorgang “in einem Rutsch” bearbeitet, produziert ein Ergebnis ohne Gliederung. Die Zerlegung in Mikroentscheidungen muss vor der Ausführung passieren - sie definiert, an welchen Stellen ein Akt entsteht, welche Regel dort gilt und wer dort entscheidet. Nachträglich lässt sich aus einem Konversations-Log keine Entscheidungsstruktur extrahieren, so wenig wie aus einem Kontoauszug eine Kostenstellenrechnung.

Zweitens: Wirksame menschliche Aufsicht braucht den Entscheidungskontext - pro Fall. Art. 14 Abs. 4 verlangt, dass die Aufsichtsperson den Output korrekt interpretieren, ihn übergehen oder rückgängig machen und das System stoppen kann - und sich der Neigung bewusst bleibt, sich automatisch auf Maschinen-Output zu verlassen. Der Gesetzgeber benennt den Automation Bias ausdrücklich. Das US-amerikanische NIST warnt im selben Sinn vor zeremoniellem Human-in-the-Loop: Ein Freigabe-Button ohne Kontext, Befugnis und Zeit schützt niemanden. Wer übersteuern soll, braucht Input, angewandte Regel, Konfidenz und Eskalationsgrund vor sich - also genau die Felder des Entscheidungsakts. Deshalb ist Human-in-the-Loop im Decision Layer ein erzwungenes Routing, kein optionaler Klick: Bei definierten Entscheidungstypen pausiert der Workflow, das Zielsystem bleibt unberührt, und die menschliche Entscheidung wird selbst als Akt dokumentiert - einschließlich der Information, ob sie der Empfehlung folgte oder von ihr abwich.

Drittens: Die Korrektur braucht die Regel-Referenz. Anfechtung ist kein Selbstzweck - sie soll Fehler beheben. Wird eine Entscheidung erfolgreich angefochten, stellt sich sofort die Frage: War es ein Einzelfehler oder ein Regelfehler? Ein Entscheidungsakt, der die angewandte Regelversion trägt, beantwortet das per Abfrage: Alle Akte derselben Regelversion sind identifizierbar, die Regel wird in einer neuen Version korrigiert, die betroffenen Fälle werden gezielt neu entschieden. Aus einem angefochtenen Einzelfall wird eine behobene Fehlerklasse. Ohne Regel-Referenz bleibt nur die manuelle Durchsicht aller Vorgänge - das Gegenteil von Skalierung.

Die Forschung nennt dieses Prinzip Contestability by Design (Alfrink et al., 2022): Systeme müssen über ihren gesamten Lebenszyklus offen für menschliche Intervention sein - als prozedurale Beziehung zwischen Entscheidungsbetroffenen und Systemverantwortlichen, eingebaut statt angebaut. Und Deloitte (2025) benennt die drei Governance-Bausteine, die Unternehmen für Agenten fehlen, fast wortgleich mit dieser Architektur: klare Grenzen, welche Entscheidungen Agenten eigenständig treffen dürfen und welche menschliche Freigabe brauchen; Echtzeit-Überwachung mit Anomalie-Erkennung; und Audit-Trails, die die vollständige Kette der Agenten-Handlungen für Verantwortlichkeit festhalten. Das Drei-Arten-Framework, das Confidence Routing und der Entscheidungsakt sind die technische Antwort auf genau diese Liste - als Designprinzip, nicht als nachträglicher Compliance-Layer.

Wer anficht - und was dann passiert

Anfechtbarkeit klingt abstrakt, hat aber vier sehr konkrete Gesichter. Der Decision Layer definiert für jede Mikroentscheidung, wem gegenüber sie sich rechtfertigen muss:

Wer anfichtRechtsgrundlageWas er siehtWas daraus folgt
Die betroffene PersonArt. 86 AI Act, Art. 15, 22 DSGVOdie Erläuterung der eigenen Entscheidung: Rolle des KI-Systems, wesentliche Elemente, auf Verlangen kontrafaktischKorrektur des Einzelfalls; bei Regelfehler Re-Run aller betroffenen Fälle
Der Betriebsrat§87 Abs. 1 Nr. 6 BetrVG, BetriebsvereinbarungAkte personalrelevanter Entscheidungen, Nachweis dass BV-Regeln technisch durchgesetzt wurdenMitbestimmung auf Evidenzbasis statt Misstrauensbasis
Der WirtschaftsprüferGoBD, IDW PS, ISAvollständige Akte pro Buchung: Beleg, Regel, Version, Konfidenz, FreigabeSystemprüfung statt Einzelfall-Nachbau; Stichprobe direkt belegbar
Die AufsichtArt. 26 Abs. 6, Art. 12 AI Act; Marktüberwachung (in Deutschland künftig Bundesnetzagentur)exportierbare, maschinenlesbare Protokolle der geforderten AufbewahrungsdauerAuskunftsfähigkeit binnen Tagen statt Forensik-Projekt

Bemerkenswert ist, was diese Tabelle mit der Organisation macht: Sie dreht die Beweislast-Dynamik um. Ohne Entscheidungsakte ist jede Anfechtung ein Forensik-Projekt mit offenem Ausgang - und nach AGG §22 trägt im Diskriminierungsfall der Arbeitgeber die Beweislast, sobald Indizien vorliegen. Mit Entscheidungsakten ist die Antwort eine Abfrage. Der Betriebsrat, der heute KI-Projekte blockiert, weil er keine Transparenz bekommt, wird zum Nutznießer derselben Infrastruktur, die auch den Wirtschaftsprüfer bedient. Andere versprechen Transparenz. Der Entscheidungsakt erzwingt sie technisch.

Die Tabelle hat eine stille Gegenseite: Wer anfechten darf, regeln Gesetz und Vereinbarung - wer dafür einsteht, dass Entscheidungsakte überhaupt entstehen, vollständig sind und Bestand haben, regelt keine Norm von selbst. Diese Verantwortung braucht einen klaren Eigentümer in der Organisation; sie fällt nicht als Nebenprodukt des Betriebs an.

Einordnung: Ein Prinzip setzt sich durch

Der ehrliche Blick auf den Markt 2026: Die Einsicht, dass Agenten-Entscheidungen einzeln nachweisbar sein müssen, ist nicht exklusiv. Gartner hat mit Guardian Agents eine eigene Marktkategorie für Kontroll-Schichten geschaffen, die Agenten-Aktionen überwachen und blockieren, und prognostiziert ihr bis 2030 zehn bis 15 Prozent des Agentic-AI-Markts. Das Decision-Intelligence-Feld - Entscheidungen explizit modellieren, bewerten und verbessern - bekam im Januar 2026 sein erstes Magic Quadrant. Das WEF fordert Progressive Governance: Aufsichtsintensität gekoppelt an die Autonomiestufe des Agenten. Die Forschung arbeitet an Decision Provenance. Die Richtung ist eindeutig - und sie ist exakt die Richtung des Decision Layer.

Was diese Ansätze nicht leisten, ist die Bindung an die Fachlichkeit. Ein Guardian Agent blockiert zur Laufzeit; er hinterlässt keinen Akt, der drei Jahre später vor dem Arbeitsgericht trägt. Observability bewahrt die Ausführungskette; sie zerlegt Entscheidungen nicht in einzeln begründete, regelgebundene Artefakte. Die verteidigbare Differenz des Entscheidungsakts liegt in drei Eigenschaften: der Attribution jeder Mikroentscheidung an eine versionierte Fachregel samt Quelle - Tarifvertrag, Betriebsvereinbarung, Steuerrecht - statt an eine generierte Begründungskette; dem architektonisch erzwungenen Human-in-the-Loop pro Entscheidungstyp statt einer abschaltbaren Konfiguration; und dem Mapping der Akte auf die Prüfungsstandards, mit denen Wirtschaftsprüfer und Revision tatsächlich arbeiten - ISA, IDW PS, GoBD. Das erste Feld dokumentiert nach unserem Kenntnisstand kein horizontaler Anbieter; es ist zugleich das Feld, an dem Anfechtbarkeit hängt.

Zur Präzision gehört auch die Abgrenzung: Der Entscheidungsakt ist eine Architekturaussage, kein Konformitätszertifikat. Ob ein konkretes System die rechtlichen Anforderungen erfüllt, bleibt eine Bewertung des Einzelfalls durch den Betreiber und seine Rechtsberater. Was die Architektur leistet, ist etwas anderes - und Wertvolleres: Sie macht die Anforderungen erfüllbar. Ein Unternehmen mit Entscheidungsakten kann die Art.-86-Frage beantworten. Ein Unternehmen mit Chat-Logs kann es nicht, egal wie gut seine Absichten dokumentiert sind.

Die eigentliche Frage

Der EU AI Act hat die Erklärbarkeit von Einzelentscheidungen nicht erfunden - er hat sie für KI-Systeme kodifiziert und mit einem Betroffenenrecht bewehrt. Die EuGH-Rechtsprechung hat den Maßstab gesetzt, bevor die erste Hochrisiko-Frist überhaupt greift. Und die Beratungshäuser haben quantifiziert, was passiert, wenn Unternehmen Entscheidungsrechte übertragen, ohne Entscheidungen nachweisen zu können: abgebrochene Projekte, blockierte Rollouts, persönlich haftende CIOs.

Die Frage an jedes Unternehmen, das KI-Agenten einsetzt oder einführt, ist deshalb nicht “Sind wir compliant?”. Sie lautet: Wenn morgen ein Mitarbeiter, ein Betriebsrat, ein Prüfer oder eine Behörde eine einzelne Entscheidung von heute anficht - können Sie den Akt vorlegen? Input, Regel, Version, Konfidenz, Ergebnis, Freigabe?

Wer diese Frage mit Ja beantworten kann, hat kein KI-Risiko-Problem mehr. Er hat eine Entscheidungs-Infrastruktur.

Decision Layer - Übersicht und Beispiele

Decision Layer erklärt: die vier Komponenten

EU AI Act: HR-KI bleibt Hochrisiko - Frist 2026/2027

Termin vereinbaren - Wir zeigen Ihnen an einem Ihrer Prozesse, wie Mikroentscheidungen, Entscheidungsakte und Anfechtungswege konkret aussehen.

Bert Gogolin

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.

Kein Spam. Jederzeit abbestellbar. Datenschutzerklärung