Einen Agent zu bauen ist einfach. Ihn Enterprise-fähig zu machen nicht.
Workflow-Agenten lassen sich in Tagen prototypisieren. ChatGPT, Claude oder Llama – ein Agent der Dokumente liest und Antworten generiert ist kein technisches Problem mehr.
Das eigentliche Problem beginnt danach: Ist die Entscheidung des Agents auditierbar? Erfüllt sie die Anforderungen des EU AI Act (Transparenz, menschliche Aufsicht, Aufzeichnungspflichten)? Kann der Betriebsrat nachvollziehen, nach welchen Regeln der Agent entscheidet? Hält die Architektur einer SOC-2-Prüfung stand?
Genau hier setzen wir an. Nicht beim Bauen des Agents – sondern bei der Governance-Schicht, die ihn produktionsfähig, prüfbar und zertifizierbar macht. Wer Governance erst nach dem PoC plant, baut zweimal.
Das Kernproblem in Unternehmen
Enterprise-Prozesse basieren auf implizitem Wissen einzelner Mitarbeiter. Tarifverträge, Betriebsvereinbarungen, Buchungslogik, Compliance-Regeln – ein komplexes Regelwerk dessen Anwendung von Person zu Person variiert.
Die Konsequenzen: Inkonsistente Entscheidungen über Standorte hinweg, Fehler die erst in der Prüfung auffallen, Know-how-Verlust bei Personalwechsel, und Prozesse die nicht skalieren weil sie an einzelnen Köpfen hängen.
Enterprise-Entscheidungen sind formal menschlich, aber oft inkonsistent dokumentiert. Ein AI Agent ersetzt keine Fachentscheidung. Er strukturiert sie, dokumentiert sie und macht sie reproduzierbar. Das Ziel ist nicht Automatisierung um der Automatisierung willen, sondern konsistente, nachvollziehbare Entscheidungsqualität über alle Standorte und Bearbeiter hinweg.
Drei Agent-Typen
Jeder Geschäftsprozess lässt sich in drei Aufgaben zerlegen: Dokumente verstehen, Abläufe koordinieren und Wissen bereitstellen. Dafür gibt es drei spezialisierte Agent-Typen – jeder mit eigenem Decision Layer, eigenem Audit Trail und klarer Abgrenzung.
01
Document Agents – Der Spezialist
Der Spezialist: versteht Dokumente. Eine Krankmeldung geht ein. Der Agent erkennt den Dokumenttyp, extrahiert Name, Zeitraum und Diagnose-Schlüssel, prüft ob alle Pflichtfelder vorhanden sind und ordnet das Dokument dem richtigen Mitarbeiter zu. Keine Template-Erkennung – echtes Sprachverständnis: Er unterscheidet eine Krankmeldung von einer AU-Bescheinigung, auch wenn beide vom selben Arzt kommen.
Architektonisch anders als OCR
Klassische OCR-Systeme erkennen Zeichen und matchen gegen Templates. Das funktioniert bei standardisierten Formularen – aber nicht bei Freitext, handschriftlichen Ergänzungen oder Dokumenten die vom erwarteten Layout abweichen. Document Agents nutzen Large Language Models für kontextuelles Verständnis: Sie lesen ein Dokument wie ein erfahrener Sachbearbeiter – und verstehen nicht nur was da steht, sondern was es im Geschäftskontext bedeutet.
Der Decision Layer bewertet jede Extraktion: Ist das Ergebnis deterministisch (Regel eindeutig)? Ist die Confidence hoch genug für autonome Verarbeitung? Oder braucht es menschliches Ermessen? Bei jeder Entscheidung wird dokumentiert: Input-Hash, angewandte Regel mit Version, Confidence Score, Routing-Entscheidung.
Was Document Agents verarbeiten
Finance & Accounting
Eingangsrechnungen, Gutschriften, Belege, Quittungen, Steuerbescheide. Integration mit SAP FI/CO und DATEV.
HR & People Operations
Krankmeldungen, AU-Bescheinigungen, Arbeitsverträge, Vertragsänderungen, Nachweise. Integration mit SAP SuccessFactors und Workday.
Compliance & Audit
Zertifikate, Bescheinigungen, regulatorische Dokumente. Automatische Fristüberwachung und Ablage im Audit Trail.
Vertragsmanagement
Vertragsprüfung, Klauselextraktion, Laufzeitüberwachung, Abweichungserkennung. Integration via SharePoint und Microsoft Graph.
Der Document Agent ersetzt keine Sachbearbeiter. Er bearbeitet die Routinefälle autonom und eskaliert Ausnahmefälle an Menschen – mit vollständiger Dokumentation, warum genau diese Entscheidung eskaliert wurde.
Der Koordinator: steuert den Gesamtprozess. Die Krankmeldung ist verstanden – und jetzt? Der Workflow Agent übernimmt: prüft im HR-System ob es die dritte Meldung in sechs Monaten ist, gleicht gegen den Tarifvertrag ab ob die Schwelle für eine Wiedereingliederung erreicht ist, erstellt eine Aufgabe für den HR-Manager in SAP SuccessFactors, informiert den Betriebsrat und plant ein Follow-up.
Architektonisch anders als RPA
RPA-Bots klicken sich durch GUIs und brechen ab, wenn sich ein Button verschiebt. Workflow Agents arbeiten über APIs, verstehen Kontext und können eigenständige Routing-Entscheidungen treffen wenn die Konfidenz ausreicht. Sie orchestrieren andere Agents (Document Agents für Dokumentverarbeitung, Knowledge Agents für Regelwerkabfragen) und koordinieren die Ergebnisse über Systemgrenzen hinweg.
Fünf Systeme, drei Entscheidungspunkte, ein Agent der den gesamten Prozess koordiniert. Jeder Schritt wird geloggt. Bei Rückfragen oder fehlenden Informationen wird der Workflow pausiert – nicht abgebrochen. Der Zustand bleibt erhalten, der Mensch entscheidet, und der Workflow setzt exakt dort fort wo er pausiert wurde.
Architekturprinzipien
Systemübergreifend: SAP, Workday, DATEV, SharePoint, Active Directory, E-Mail – alles über APIs, nicht GUI-Automation.
Entscheidungsbasiert: An jedem Entscheidungspunkt prüft der Decision Layer: autonome Verarbeitung oder Human-in-the-Loop?
Pausierbar: Workflows halten an wenn menschliches Ermessen nötig ist. Der Agent wartet auf die Entscheidung und setzt danach fort.
Idempotent: Jeder Schritt kann wiederholt werden ohne Seiteneffekte. Kein doppeltes Buchen, kein verlorener Zustand.
Versioniert: Jede angewandte Regel wird mit Version dokumentiert. Wenn sich der Tarifvertrag ändert, verarbeitet der Agent neue Fälle mit der neuen Version – ohne alte Entscheidungen rückwirkend zu ändern.
Einsatzbereiche
HR-Prozesse
Onboarding, Krankmeldung, Vertragsänderung, Offboarding. SAP SuccessFactors + Active Directory + E-Mail.
Finance-Prozesse
Invoice-to-Payment, Belegverarbeitung, Kontenabstimmung. SAP FI/CO + DATEV.
Compliance-Prozesse
Regelbasierte Prüfungen, Fristüberwachung, automatische Evidence-Generierung für Audits.
Der Wissensträger: beantwortet Fragen aus dem Unternehmenswissen. Ein HR-Manager fragt: 'Ab wann muss bei Langzeiterkrankung ein BEM-Verfahren eingeleitet werden?' Der Agent sucht nicht nur – er interpretiert Betriebsvereinbarung, Tarifvertrag und gesetzliche Vorgaben im Kontext der Frage, und liefert eine spezifische Antwort mit Quellenangabe, Regelversion und Gültigkeitsdatum.
Architektonisch anders als Suchmaschinen und Chatbots
Eine Enterprise-Suchmaschine findet Dokumente. Ein Chatbot generiert Antworten – ohne Gewähr. Ein Knowledge Agent kombiniert beides: Er findet die relevanten Quellen (Retrieval-Augmented Generation / RAG), interpretiert sie im Kontext der Frage und liefert eine spezifische Antwort mit verifizierter Quellenangabe.
Der entscheidende Unterschied: Ein Knowledge Agent beantwortet keine Frage ohne verifizierte Quelle. Bei fehlender oder widersprüchlicher Regelung antwortet er nicht, sondern verweist an die zuständige Stelle. Er halluziniert nicht – weil die Architektur es verhindert.
Fünf Schutzmaßnahmen gegen Halluzination
Retrieval-First: Der Agent antwortet nur auf Basis abgerufener Quellen, nie aus dem allgemeinen Modellwissen.
Quellenverifikation: Jede Aussage wird gegen die Quelldokumente geprüft. Stimmt die Interpretation nicht, wird die Antwort verworfen.
Confidence Scoring: Liegt die Confidence unter dem Schwellwert, wird die Antwort als unsicher markiert oder an einen Menschen eskaliert.
Keine Spekulation: Bei fehlender Regelung sagt der Agent explizit, dass keine Regelung gefunden wurde – statt eine plausibel klingende Antwort zu erfinden.
Frage: „Wie viele Tage Sonderurlaub habe ich bei Umzug?"
Antwort: „Gemäß Betriebsvereinbarung BV-2024-007, §3 Abs. 2 (Version 2024.2, gültig seit 01.04.2024) stehen Ihnen bei Umzug 2 Arbeitstage Sonderurlaub zu. Für tarifgebundene Mitarbeiter gilt zusätzlich §29 TV-L, der 1 weiteren Tag vorsieht."
Betriebsvereinbarungen, Tarifverträge, Richtlinien, Compliance-Handbücher, FAQ-Kataloge, Prozessdokumentation. Alle Quellen werden versioniert über eine RAG-Pipeline verwaltet. Neue Versionen werden automatisch erkannt, indiziert und mit Gültigkeitsdatum versehen.
Kanäle: Teams Bot, SharePoint-Einbettung, Web UI, API. Die Wissensbasis wird über SharePoint, Confluence oder direkte Uploads gepflegt.
In der Praxis arbeiten die drei Agent-Typen zusammen. Ein Workflow Agent orchestriert den Gesamtprozess und ruft Document Agents und Knowledge Agents als Spezialisten auf.
Beispiel: Krankmeldung End-to-End
Document Agent erkennt die Krankmeldung im E-Mail-Eingang, extrahiert Name, Zeitraum und Diagnose-Schlüssel.
Workflow Agent prüft im HR-System: Ist es die dritte Meldung in sechs Monaten?
Knowledge Agent wird aufgerufen: „Ab welcher Schwelle greift die BEM-Pflicht laut aktuellem Tarifvertrag?"
Workflow Agent wertet die Antworten aus: BEM-Schwelle nicht erreicht → Standardprozess.
Decision Layer prüft §5 EFZG und Betriebsvereinbarungs-Constraints → Lohnfortzahlung berechnen.
Workflow Agent erstellt SAP-Buchungsvorschlag, informiert HR-Manager, dokumentiert im Audit Trail.
Sechs Schritte, drei Agent-Typen, drei Systeme – ein durchgängiger Audit Trail.
Wie AI-Agenten architektonisch funktionieren – MCP, A2A, Multi-Agent-Systeme und auf welcher Plattform sie orchestriert werden – beschreibt der
Agent-Leitfaden unseres Blueprint 2026.
Decision Layer
Der Decision Layer zerlegt jeden Geschäftsprozess in einzelne Entscheidungsschritte und definiert für jeden Schritt: Mensch, Regelwerk oder KI. Jede Entscheidung wird dokumentiert – prüfbar für Wirtschaftsprüfer, Betriebsrat und interne Revision.
Was der Decision Layer prüft: Fachliche Regelwerke (Tarifverträge, Betriebsvereinbarungen, Buchungslogik), Confidence Score des Modells, Risiko-Score der Entscheidung, Betriebsvereinbarungs-Constraints, Bias- und Diskriminierungspotenzial.
Was er erzeugt: Vollständigen Audit-Trail-Eintrag pro Entscheidung, Input-Hash für Reproduzierbarkeit, Regelversion pro angewandter Regel, Routing-Entscheidung (autonom oder Human-in-the-Loop).
Für jeden Agent-Typ anders: Bei Document Agents prüft der Decision Layer Extraktionsqualität und Confidence. Bei Workflow Agents steuert er das Routing an Entscheidungspunkten. Bei Knowledge Agents verhindert er Halluzination und erzwingt Quellenverifikation.
AI-Agenten ersetzen keine bestehenden Systeme. SAP bleibt ERP. Workday bleibt HCM. DATEV bleibt Steuersystem. Die Agent-Logik ist vom Zielsystem entkoppelt – wechselt das Zielsystem, ändert sich nur der Adapter, nicht die Geschäftslogik.
SAP FI/CO, SAP S/4HANA: Buchungsvorschläge, Kontenabstimmung, Belegverarbeitung
SAP SuccessFactors: Personalstammdaten, Onboarding, Zeitwirtschaft
Die Architektur ist nicht an ein einzelnes LLM gebunden. Der Model Layer ist austauschbar:
Claude (Anthropic) – aktuell stärkstes Modell für komplexe Textanalyse
ChatGPT (OpenAI) – breites Einsatzspektrum
Gemini (Google) – tiefe Integration mit Google-Diensten
Llama (Meta) – Open Source, Self-Hosted möglich
Mistral – Open Source, EU-basiert
DeepSeek – Open Source, kosteneffizient
gpt-oss (OpenAI) – Open Source, Self-Hosted möglich
Wenn ein neues Modell verfügbar wird, kann es integriert werden ohne die Geschäftslogik zu ändern. Kein Vendor Lock-in auf ein einzelnes Modell.
Business Impact
Routinefälle werden autonom verarbeitet – mit vollständiger Dokumentation
Ausnahmefälle werden an Menschen eskaliert – mit Kontext und Empfehlung
Gleiche Regelinterpretation über alle Standorte hinweg
Jede Entscheidung nachvollziehbar für Prüfer und Betriebsrat
Skalierbar ohne proportionalen Personalaufbau
Know-how bleibt im System – nicht in einzelnen Köpfen
Code-Eigentum und Exit-Strategie
Vollständiger Source Code, alle Prompts, alle Regelwerke gehören dem Kunden. Nach 12–18 Monaten betreiben Sie Ihre Agenten eigenständig. Gosign baut und befähigt – und geht dann.
Kein SaaS-Abo, kein Platform Lock-in, keine laufenden Lizenzkosten für die Agent-Logik. Sie bezahlen für Engineering und Wissenstransfer – nicht für Abhängigkeit.
Häufige Fragen zu AI-Agenten
Welche Daten verlassen das Unternehmen?
Keine. Agenten laufen in Ihrer Infrastruktur – Cloud, Self-Hosted oder hybrid. Bei Cloud-LLMs gelten die DPAs des jeweiligen Anbieters. Bei Self-Hosted-Modellen verlassen keine Daten das Unternehmensnetzwerk.
Wie lange dauert ein Pilotprojekt?
4–6 Wochen bis zum produktiven PoC. Discover (1 Woche), Build (3–4 Wochen). Der erste Agent läuft live in Ihrer Infrastruktur mit Decision Layer und Audit Trail.
Ist das betriebsratsfähig?
Ja. Human-in-the-Loop als Architekturprinzip, vollständiges Logging, Rollenkonzept, Audit Trail. Betriebsvereinbarungen werden als explizite Constraints im Decision Layer abgebildet.
Welche Modelle werden verwendet?
Die Architektur ist modell-agnostisch. Aktuell: Claude, ChatGPT, Gemini, Llama, Mistral, DeepSeek, gpt-oss. Modelle sind austauschbar ohne Änderung der Geschäftslogik.
Wie arbeiten die drei Agent-Typen zusammen?
Ein Workflow Agent orchestriert den Gesamtprozess und ruft bei Bedarf Document Agents (für Dokumentverarbeitung) und Knowledge Agents (für Regelwerkabfragen) auf. Jeder Agent hat seinen Decision Layer, und der Workflow Agent koordiniert die Ergebnisse über Systemgrenzen hinweg.
Vertiefen
Enterprise AI-Infrastruktur Blueprint 2026
Von Chatbots zu AI-Agenten: MCP- und A2A-Protokolle, Multi-Agent-Systeme, Agent-Orchestrierung mit n8n und Camunda – und wie der Decision Layer Kontrolle sicherstellt.