Was ist der Unterschied zwischen einem KI-Agenten und einem Chatbot?

Ein Chatbot beantwortet Fragen in natürlicher Sprache. Ein KI-Agent führt fachliche Aufgaben aus: Er liest Dokumente, trifft Entscheidungen, löst Aktionen in Zielsystemen aus und dokumentiert jeden Schritt.

Was ist der Unterschied zwischen KI-Agenten und RPA?

RPA automatisiert regelbasierte, repetitive Aufgaben über Benutzeroberflächen. KI-Agenten verstehen Kontext, interpretieren unstrukturierte Daten und treffen Entscheidungen auf Basis von Sprachverständnis - nicht auf Basis starrer Wenn-Dann-Regeln.

Was sind KI-Agenten? Drei Typen für Unternehmen

Q: Welche Typen von KI-Agenten gibt es?

Drei Grundtypen: Document Agents (lesen und verarbeiten Dokumente), Workflow Agents (orchestrieren Prozesse systemübergreifend), Knowledge Agents (liefern kontextbasierte Antworten aus Unternehmenswissen).

Auf einen Blick - KI-Agenten im Unternehmen

KI-Agenten sind spezialisierte Softwarekomponenten, die fachliche Aufgaben autonom ausführen - anders als Chatbots (nur Antworten) oder RPA (nur regelbasiert).
Drei Typen: Document Agents (Dokumente lesen und verarbeiten), Workflow Agents (Prozesse systemübergreifend orchestrieren), Knowledge Agents (kontextbasierte Antworten aus Unternehmenswissen).
McKinsey (2024) schätzt, dass KI-Agenten bis 2030 bis zu 30 % der Arbeitsstunden in den meisten Berufen automatisieren könnten.
Der Agent ist nicht das Modell - das Sprachmodell ist austauschbar, der Agent liefert Fachlogik, Systemintegration und Governance.
Enterprise-Einsatz erfordert einen Decision Layer zwischen Agent und Zielsystem - damit jede automatisierte Entscheidung nachvollziehbar, auditierbar und compliant ist.

Was ist ein KI-Agent?

Ein KI-Agent ist eine spezialisierte Softwarekomponente, die auf Basis von Large Language Models (LLMs) fachliche Aufgaben autonom ausführt. Im Unterschied zu einem Chatbot, der auf Fragen antwortet, führt ein Agent Handlungen aus: Er liest ein Dokument, bewertet den Inhalt, trifft eine Entscheidung und löst eine Aktion in einem Zielsystem aus.

KI-Agenten im Enterprise-Kontext arbeiten nicht frei. Sie operieren innerhalb definierter Grenzen: Regelwerke, Geltungsbereiche, Konfidenzschwellen, Eskalationsregeln. Jede Agenten-Entscheidung ist nachvollziehbar und auditierbar.

Die Grundlage eines KI-Agenten ist ein Sprachmodell - Claude, ChatGPT, Gemini, Llama, Mistral, DeepSeek oder gpt-oss. Das Modell liefert das Sprachverständnis. Der Agent liefert die Fachlogik, die Systemintegration und die Governance.

Abgrenzung: KI-Agent vs. Chatbot vs. RPA

Diese drei Konzepte werden häufig verwechselt. Sie lösen unterschiedliche Probleme.

Chatbot: Ein Chatbot beantwortet Fragen in natürlicher Sprache. Er hat keine Handlungskompetenz. Wenn ein Mitarbeiter fragt “Wie viele Urlaubstage habe ich noch?”, antwortet der Chatbot. Er bucht keinen Urlaub, er prüft keine Regeln, er erzeugt keinen Audit Trail.

RPA (Robotic Process Automation): RPA automatisiert regelbasierte, repetitive Aufgaben über Benutzeroberflächen. Ein RPA-Bot klickt sich durch SAP, kopiert Daten von A nach B, füllt Formulare aus. RPA hat kein Sprachverständnis. Wenn sich das Formular ändert, bricht der Bot.

KI-Agent: Ein KI-Agent versteht Kontext, interpretiert unstrukturierte Daten und trifft Entscheidungen. Er liest eine Rechnung - unabhängig vom Format - versteht den Inhalt, wendet Regelwerke an und erzeugt einen Buchungsvorschlag. Wenn sich das Rechnungsformat ändert, funktioniert der Agent weiter, weil er den Inhalt versteht, nicht das Layout erkennt.

Eigenschaft	Chatbot	RPA	KI-Agent
Sprachverständnis	Ja	Nein	Ja
Handlungskompetenz	Nein	Ja (regelbasiert)	Ja (kontextbasiert)
Unstrukturierte Daten	Ja	Nein	Ja
Governance/Audit	Nein	Teilweise	Ja (über Decision Layer)
Systemintegration	Oberflächlich	Über UI	Über API/Integration Layer
Anpassung bei Änderungen	Prompt ändern	Bot neu programmieren	Agent lernt Kontext

Drei Typen von Enterprise KI-Agenten

In der Gosign-Architektur gibt es drei Agent-Typen. Jeder Typ hat einen definierten Aufgabenbereich und arbeitet innerhalb der Grenzen, die der Decision Layer vorgibt.

Document Agents

Document Agents lesen, verstehen und verarbeiten Dokumente. Rechnungen, Krankmeldungen, Verträge, Bescheinigungen, Belege, Gutschriften.

Der entscheidende Unterschied zu OCR oder Template-Erkennung: Document Agents haben echtes Sprachverständnis. Sie erkennen nicht Felder an bestimmten Positionen auf einer Seite, sondern verstehen den Inhalt des Dokuments. Eine Rechnung im PDF-Format, als gescanntes Bild oder als E-Mail-Anhang - der Document Agent versteht alle drei.

Ein Document Agent für Belegverarbeitung liest eine Eingangsrechnung und extrahiert: Rechnungssteller, Betrag, Leistungsbeschreibung, Datum, Steuersatz, Bankverbindung. Er erzeugt einen strukturierten Datensatz, der an den Decision Layer übergeben wird.

Document Agents arbeiten nicht isoliert. Sie sind der Eingangspunkt eines Workflows - nach dem Lesen des Dokuments übernimmt der Workflow Agent.

Workflow Agents

Workflow Agents orchestrieren Prozesse systemübergreifend. Sie koordinieren den Ablauf zwischen Document Agent, Decision Layer und Zielsystem.

Ein Workflow Agent für die Rechnungsverarbeitung koordiniert: Der Document Agent liest die Rechnung → der Decision Layer prüft den Buchungsvorschlag → bei hoher Konfidenz geht die Buchung ins Zielsystem → bei niedriger Konfidenz wird an den Sachbearbeiter eskaliert → nach Freigabe wird die Buchung abgeschlossen → der gesamte Vorgang wird im Audit Trail dokumentiert.

Workflow Agents handhaben auch Ausnahmen: Was passiert, wenn das Zielsystem nicht erreichbar ist? Was passiert bei einem Timeout? Was passiert, wenn der Sachbearbeiter nicht reagiert? Der Workflow Agent hat Eskalationsregeln, Retry-Mechanismen und Timeout-Logik.

Die Workflow-Orchestrierung läuft über Trigger.dev oder Camunda - je nach Komplexität und Compliance-Anforderungen des Kunden. Workflows sind versioniert, testbar und als Code definierbar.

Knowledge Agents

Knowledge Agents liefern kontextbasierte Antworten aus dem Unternehmenswissen. Betriebsvereinbarungen, Richtlinien, Tarifverträge, Compliance-Regeln, interne Policies.

Der Unterschied zu einer Suchfunktion: Ein Knowledge Agent versteht die Frage, sucht im relevanten Kontext und liefert eine Antwort mit Quellenangabe und Regelversion. Wenn ein Sachbearbeiter fragt “Gilt die Nachtarbeitszulage auch für Teilzeitkräfte im Tarifgebiet West?”, liefert der Knowledge Agent die Antwort mit Verweis auf die gültige Betriebsvereinbarung in der aktuellen Version.

Knowledge Agents nutzen RAG (Retrieval Augmented Generation): Das Unternehmenswissen wird in einer Vektordatenbank indexiert. Der Agent sucht die relevanten Passagen und generiert eine Antwort auf Basis dieser Quellen - nicht auf Basis seines Trainings.

Jede Antwort enthält: Die Quelle, die Regelversion, das Gültigkeitsdatum. Keine Halluzinationen, keine erfundenen Regelverweise.

Wie KI-Agenten in der Enterprise-Architektur zusammenwirken

Die drei Agent-Typen arbeiten nicht isoliert. In einer typischen Enterprise-Implementierung orchestriert der Workflow Agent den Gesamtprozess und delegiert an spezialisierte Document und Knowledge Agents.

Ein Beispiel aus der HR-Sachbearbeitung: Eine Krankmeldung geht ein (E-Mail mit PDF-Anhang). Der Document Agent liest die Krankmeldung und extrahiert: Mitarbeiter, Zeitraum, ärztliche Bescheinigung, Folgebescheinigung. Der Knowledge Agent prüft: Welche Regeln gelten für diesen Mitarbeiter? Tarifvertrag, Betriebsvereinbarung, individuelle Zusatzvereinbarungen. Der Decision Layer bewertet: Ist die Entgeltfortzahlung korrekt berechnet? Stimmen die Fristen? Der Workflow Agent koordiniert den gesamten Ablauf und stellt sicher, dass alle Systeme aktualisiert werden.

Jeder Agent hat seinen definierten Aufgabenbereich. Kein Agent “entscheidet” allein über geschäftskritische Vorgänge. Der Decision Layer sitzt zwischen Agent und Zielsystem und stellt Governance sicher.

Modell-Agnostik: Der Agent ist nicht das Modell

Eine häufige Verwechslung: Der Agent ist nicht das Sprachmodell. Das Modell (Claude, ChatGPT, Llama) liefert das Sprachverständnis. Der Agent liefert die Fachlogik, die Systemintegration, die Governance.

In der Gosign-Architektur ist der Model Layer austauschbar. Wenn ein neues Modell verfügbar wird - leistungsfähiger, günstiger, mit besserer Lizenz - kann es integriert werden, ohne die darüberliegenden Layer zu ändern. Die Geschäftslogik im Decision Layer, die Workflows, die Regelwerke bleiben unverändert.

Ein Agent kann auch mehrere Modelle nutzen: Ein kostengünstiges Open-Source-Modell für die Vorklassifizierung und ein leistungsfähigeres Modell für komplexe Entscheidungen. Das Routing zwischen Modellen ist konfigurierbar.

Diese Modell-Agnostik verhindert Vendor Lock-in. Kein Unternehmen ist auf einen einzelnen Modellanbieter angewiesen.

Voraussetzungen für Enterprise KI-Agenten

KI-Agenten in Enterprise-Umgebungen brauchen mehr als ein Sprachmodell:

Governance: Jede Agenten-Entscheidung muss nachvollziehbar und auditierbar sein. Der Decision Layer stellt das sicher.

Integration: Agenten müssen in bestehende Systeme integriert werden - SAP, DATEV, Workday, SuccessFactors, SharePoint. Der Integration Layer entkoppelt die Agent-Logik vom Zielsystem.

Infrastruktur: Agenten brauchen eine Laufzeitumgebung: LLM-Hosting, Vektordatenbanken für RAG, Workflow-Engine, API-Gateway. Diese Infrastruktur kann in der Cloud, Self-Hosted oder hybrid betrieben werden.

Mitbestimmung: In Deutschland haben Betriebsräte Mitbestimmungsrechte bei der Einführung von KI-Systemen. Die Architektur muss das von Anfang an berücksichtigen.

Mehr dazu: AI Agents im Detail

Termin vereinbaren - Wir zeigen Ihnen, welcher Agent-Typ für Ihren Prozess passt.

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.