Was ist ein Workflow-Audit für Agent Readiness?

Ein Workflow-Audit ist eine strukturierte Analyse, die einen HR-Prozess in seine einzelnen Entscheidungspunkte zerlegt, jeden Entscheidungspunkt nach Typ klassifiziert (Mensch, regelbasiert oder KI-geeignet) und einen Agent-Readiness-Score berechnet. Das Ergebnis ist eine Karte, die genau zeigt, welche Teile eines Workflows automatisiert werden können, welche menschliche Aufsicht erfordern und welche vollständig beim Menschen bleiben müssen.

Wie viele Entscheidungspunkte hat ein typischer HR-Workflow?

Das hängt von der Komplexität ab. Einfache Workflows wie Zeiterfassungs-Validierung haben 4 - 6 Entscheidungspunkte. Krankmeldungsverarbeitung hat 10 - 15. Onboarding hat 20 - 30. Monatliche Payroll für eine Multi-Entity-Organisation kann 40+ haben. Das Audit macht diese Entscheidungspunkte sichtbar - die meisten Unternehmen unterschätzen, wie viele Einzelentscheidungen ihre Prozesse enthalten.

Was ist der Unterschied zwischen einer regelbasierten und einer KI-geeigneten Entscheidung?

Eine regelbasierte Entscheidung folgt deterministischer Logik: wenn Bedingung X, dann Ergebnis Y, ohne Mehrdeutigkeit. Eine KI-geeignete Entscheidung beinhaltet die Interpretation unstrukturierter Information - ein Dokument klassifizieren, Daten aus Freitext extrahieren, eine Beschreibung gegen Kriterien abgleichen - aber innerhalb definierter Grenzen. Beide können automatisiert werden, nutzen aber unterschiedliche technische Ansätze.

Wie lange dauert ein Workflow-Audit?

Ein einzelnes Workflow-Audit dauert typischerweise 2 - 4 Stunden mit den richtigen Teilnehmern: ein Prozessexperte der den Workflow täglich ausführt, ein Fachverantwortlicher der die Geschäftsregeln verantwortet, und eine dokumentierende Person. Eine Organisation kann ihre 10 volumenstärksten Workflows in etwa zwei Wochen auditieren.

Workflow-Audit für Agent Readiness: Methodik

Was diese Methodik leistet

Dieser Artikel beschreibt eine wiederholbare Methode zur Bewertung, ob ein HR-Workflow - oder bestimmte Teile davon - von einem KI-Agenten übernommen werden kann. Die Methode produziert drei Ergebnisse: eine Entscheidungskarte mit jedem einzelnen Entscheidungspunkt im Workflow, eine Klassifikation jedes Entscheidungspunkts nach Typ, und einen Agent-Readiness-Score der quantifiziert, wie viel des Workflows automatisierbar ist.

Die Methodik ist technologie-agnostisch. Sie setzt keine bestimmte KI-Plattform, keinen Anbieter und keinen Technology Stack voraus. Sie funktioniert gleichermaßen für Organisationen, die ihr erstes Agent-Deployment evaluieren, wie für solche, die ein bestehendes auf neue Domänen erweitern.

McKinsey (2024) schätzt, dass 60-70 % der Arbeitstätigkeiten in HR-Abteilungen mit bestehender Technologie teilweise automatisierbar sind. Das Workflow-Audit identifiziert genau welche Teile - Entscheidungspunkt für Entscheidungspunkt.

Auf einen Blick - Workflow-Audit für Agent Readiness

Ein Workflow-Audit zerlegt HR-Prozesse in einzelne Entscheidungspunkte und klassifiziert jeden als Mensch, regelbasiert oder KI-geeignet.
Das Ergebnis sind drei Deliverables: eine Entscheidungskarte, eine Klassifikation pro Punkt und ein Agent-Readiness-Score, der das Automatisierungspotenzial quantifiziert.
Typische HR-Workflows enthalten 10-30 Entscheidungspunkte - die meisten Organisationen unterschätzen diese Zahl erheblich.
Die Methodik ist technologie-agnostisch: keine bestimmte KI-Plattform, kein Anbieter und kein Technology Stack wird vorausgesetzt.
Ein Workflow-Audit dauert 2-4 Stunden. Eine Organisation kann ihre Top-10-Workflows in etwa zwei Wochen auditieren.

Schritt 1: Workflow-Grenze definieren

Bevor Entscheidungspunkte analysiert werden, muss definiert werden, was der Workflow ein- und ausschließt.

Ein Workflow hat einen Auslöser (was ihn startet), eine Reihe von Verarbeitungsschritten und einen oder mehrere Endpunkte (was als Abschluss gilt). Er hat auch eine Scope-Grenze - wo er mit anderen Workflows interagiert.

Beispiel: Krankmeldungsverarbeitung

Auslöser: Mitarbeiter reicht Krankmeldung ein (Papier, E-Mail, Portal-Upload oder Meldung durch Vorgesetzten)
Endpunkte: SAP-Datensatz aktualisiert, Vorgesetzter informiert, Payroll angepasst falls erforderlich, Wiedereingliederungs-Aktion geplant falls Schwelle überschritten
Scope-Grenze: Dieser Workflow beinhaltet NICHT das Wiedereingliederungsgespräch selbst (das ist ein separater Workflow). Er beinhaltet NICHT den BEM-Prozess - dieser wird durch diesen Workflow ausgelöst, aber separat gesteuert.

Häufiger Fehler: Die Grenze zu weit fassen. „Onboarding” ist nicht ein Workflow - es ist eine Sammlung von 5 - 8 Teil-Workflows (Vertragserstellung, IT-Provisioning, Compliance-Dokumentation, Arbeitsplatzeinrichtung, Schulungsanmeldung, Buddy-Zuordnung, Probezeit-Tracking). Jeden Teil-Workflow separat auditieren.

Schritt 2: Jeden Entscheidungspunkt kartieren

Den Workflow vom Auslöser bis zum Endpunkt durchgehen und jeden Punkt identifizieren, an dem eine Entscheidung getroffen wird. Ein Entscheidungspunkt ist jeder Moment, in dem der Prozess eine Wahl zwischen zwei oder mehr Pfaden auf Basis von Eingabedaten erfordert.

Die meisten Organisationen unterschätzen die Anzahl der Entscheidungspunkte in ihren Prozessen. Der Grund: Erfahrene Mitarbeiter treffen viele Entscheidungen unbewusst. Sie nehmen „prüfen ob die Krankmeldung ein Startdatum hat” nicht als Entscheidung wahr - sie tun es einfach. Aber für einen Agenten ist jede solche Prüfung eine explizite Entscheidung, die spezifiziert werden muss.

Methode: Die „Was könnte schiefgehen”-Technik

Für jeden Schritt im Workflow fragen: „Was könnte hier schiefgehen? Was würde dazu führen, dass dieser Schritt fehlschlägt oder eine andere Aktion erfordert?” Jede Antwort offenbart einen Entscheidungspunkt.

Krankmeldungsverarbeitung - Entscheidungskarte:

#	Entscheidungspunkt	Frage die der Prozess beantwortet
1	Dokumenteneingang	Ist dies eine Krankmeldung, ein ärztliches Attest, eine Reha-Bescheinigung oder etwas anderes?
2	Vollständigkeitsprüfung	Enthält das Dokument: Mitarbeitername, Beginn der Diagnoseperiode, Ende der Diagnoseperiode, Arztname, Arztunterschrift?
3	Mitarbeiteridentifikation	Welchem Mitarbeiter gehört dieses Dokument? (Namensabgleich, Personalnummer, Abteilung)
4	Gesellschaftszuordnung	In welcher Gesellschaft ist dieser Mitarbeiter? (Bestimmt das geltende Regelwerk)
5	Tarifvertrags-Lookup	Welcher Tarifvertrag gilt für diesen Mitarbeiter?
6	Lohnfortzahlungsanspruch	Befindet sich der Mitarbeiter im 6-Wochen-Lohnfortzahlungszeitraum (§ 3 EFZG)? Ist die Wartezeit (§ 3 Abs. 3 EFZG) erfüllt?
7	Dauerbewertung	Handelt es sich um einen einzelnen Tag, eine Kurzabwesenheit (≤3 Tage) oder eine längere Abwesenheit?
8	Mustererkennung	Löst diese Abwesenheit, zusammen mit vorherigen Abwesenheiten, eine Schwelle aus? (z.B. >6 Wochen in 12 Monaten → BEM-Pflicht)
9	Payroll-Auswirkung	Hat diese Abwesenheit Auswirkung auf die Gehaltsabrechnung? (Überstundenstornierung, Schichtzuschlag, Bonusanteilung)
10	Systemaktualisierung	Was muss in SAP/SuccessFactors aktualisiert werden? (Abwesenheitsdatensatz, Zeitkonto, Payroll-Flag)
11	Benachrichtigungs-Routing	Wer muss informiert werden? (Vorgesetzter, HR Business Partner, Payroll, Betriebsrat falls BEM ausgelöst)
12	Folgeaktion-Planung	Ist eine Folgeaktion erforderlich? (Rückkehrdatum, BEM-Einladung, betriebsärztliche Überweisung)

Zwölf Entscheidungspunkte in einem Prozess, den die meisten Organisationen als „Mitarbeiter reicht Krankmeldung ein, wir verarbeiten sie” beschreiben. Die Lücke zwischen wahrgenommener Einfachheit und tatsächlicher Komplexität ist typisch.

Schritt 3: Jeden Entscheidungspunkt klassifizieren

Für jeden Entscheidungspunkt bestimmen, welchem der drei Typen er angehört. Die Klassifikationskriterien müssen streng angewandt werden - der häufigste Fehler ist, eine Entscheidung als „regelbasiert” zu klassifizieren, wenn sie tatsächlich Interpretation erfordert.

Typ H: Mensch entscheidet

Die Entscheidung erfordert eines oder mehrere der folgenden Merkmale:

Empathie oder individuelles Ermessen - das Ergebnis hängt davon ab, die spezifische Situation einer Person zu verstehen, nicht davon, eine allgemeine Regel anzuwenden
Rechtliches Risiko bei Automatisierung - eine fehlerhafte automatisierte Entscheidung würde erhebliche rechtliche, finanzielle oder Reputationsrisiken erzeugen
Mitbestimmungsmandat - der Betriebsrat hat ausdrücklich menschliche Beteiligung für diesen Entscheidungstyp gefordert
Ethische Sensibilität - die Entscheidung beinhaltet das Abwägen konkurrierender Interessen, bei denen vernünftige Menschen unterschiedlicher Meinung sein könnten

Testfrage: „Wenn zwei verschiedene erfahrene Fachleute denselben Fall betrachten, würden sie zuverlässig zum selben Ergebnis kommen?” Falls nein - Typ H.

Typ R: Regelbasiert (deterministisch)

Die Entscheidung folgt expliziter Logik, die als eindeutige Wenn-Dann-Aussage formuliert werden kann. Alle folgenden Bedingungen müssen erfüllt sein:

Die Regel existiert schriftlich - in einem Gesetz, Tarifvertrag, einer Betriebsvereinbarung oder dokumentierten Verfahrensanweisung
Die Eingabedaten sind strukturiert - Namen, Daten, Zahlen, Codes, Kategorien - kein Freitext der Interpretation erfordert
Das Ergebnis ist deterministisch - bei gleicher Eingabe produziert die Regel immer dasselbe Ergebnis
Es gibt keine Ausnahmen die Ermessen erfordern - oder die Ausnahmen sind selbst regelbasiert („wenn Ausnahme X, dann wende Regel Y an”)

Testfrage: „Könnte ich diese Entscheidung als Formel in einer Tabellenkalkulation schreiben, ohne menschliche Interpretation?” Falls ja - Typ R.

Typ A: KI-geeignet (probabilistisch mit Grenzen)

Die Entscheidung beinhaltet die Verarbeitung unstrukturierter oder semi-strukturierter Information - aber innerhalb definierter Grenzen und mit überprüfbaren Ergebnissen. Alle folgenden Bedingungen müssen erfüllt sein:

Die Aufgabe ist Klassifikation, Extraktion oder Abgleich - nicht Erstellung, Bewertung oder Beurteilung
Die Grenzen sind definiert - die Menge möglicher Ergebnisse ist bekannt und endlich
Das Ergebnis ist überprüfbar - es gibt eine Möglichkeit zu kontrollieren, ob die KI-Entscheidung korrekt war
Ein Konfidenzschwellenwert ist setzbar - das System kann Sicherheit ausdrücken, und unsichere Fälle können an einen Menschen eskaliert werden

Testfrage: „Interpretiert dies Information gegen bekannte Kategorien, oder beurteilt es eine einzigartige Situation?” Falls Interpretation gegen Kategorien - Typ A. Falls Beurteilung einer einzigartigen Situation - Typ H.

Angewandt auf unser Krankmeldungs-Beispiel:

#	Entscheidungspunkt	Typ	Begründung
1	Dokumentenklassifikation	A	Unstrukturierte Eingabe (gescanntes Dokument), aber Klassifikation in bekannte Kategorien. Konfidenz-bewertbar.
2	Vollständigkeitsprüfung	A	Feldextraktion aus unstrukturiertem Dokument. Bekannte Pflichtfelder. Überprüfbar.
3	Mitarbeiteridentifikation	A	Namensabgleich gegen Mitarbeiterdatenbank. Kann Fuzzy Matching erfordern. Konfidenz-bewertbar.
4	Gesellschaftszuordnung	R	Personalnummer → Gesellschaft ist deterministisch. Lookup-Tabelle.
5	Tarifvertrags-Lookup	R	Gesellschaft + Mitarbeiterkategorie → Tarifvertrag. Deterministisch.
6	Lohnfortzahlungsanspruch	R	Startdatum + Abwesenheitshistorie + § 3 EFZG Regeln. Reine Berechnung.
7	Dauerbewertung	R	Kalenderberechnung. Deterministisch.
8	Mustererkennung	R	Abwesenheitshistorie + Schwellenwert-Regeln. Deterministisch (obwohl die Reaktion auf eine ausgelöste Schwelle Typ H sein kann).
9	Payroll-Auswirkung	R	Abwesenheitstyp + Dauer + Vergütungsregeln. Deterministisch.
10	Systemaktualisierung	R	Bestimmt durch Entscheidungen 4 - 9. Ausführungsschritt.
11	Benachrichtigungs-Routing	R	Routing-Regeln basierend auf Gesellschaft, Abwesenheitstyp, Schwellenwert-Auslösern. Deterministisch.
12	Folgeaktion-Planung	R	Basierend auf Dauer, Schwellenwert und Richtlinie. Deterministisch - obwohl die Folgeaktion selbst (z.B. das BEM-Gespräch) Typ H ist.

Ergebnis: 0 Mensch, 8 regelbasiert, 3 KI-geeignet, 1 bedingt (R für die Planung, H für die Folgeaktion selbst).

Schritt 4: Agent-Readiness-Score berechnen

Der Score ist ein einfaches Verhältnis, das quantifiziert, wie viel des Workflows automatisierbar ist.

Formel:

Agent Readiness Score = (Typ R Anzahl + Typ A Anzahl) / Gesamtzahl Entscheidungspunkte × 100

Für unser Krankmeldungs-Beispiel: (8 + 3) / 12 = 91,7%

Dies ist ein hoher Score. Er zeigt, dass fast der gesamte Workflow von einem Agenten übernommen werden kann, mit menschlicher Beteiligung nur für nachgelagerte Aktionen (das BEM-Gespräch, das Wiedereingliederungsgespräch), die separate Workflows sind.

Score-Interpretation:

Score	Interpretation	Deployment-Empfehlung
>80%	Hohe Agent Readiness	Starker Kandidat für sofortiges Deployment. Die meisten Entscheidungspunkte sind automatisierbar. Governance-Design auf die wenigen Typ-H-Übergaben fokussieren.
60 - 80%	Moderate Agent Readiness	Guter Kandidat für phasenweises Deployment. Typ-R- und Typ-A-Entscheidungen zuerst automatisieren, Typ H manuell belassen. Bedeutsame Human-in-the-Loop-Arbeitslast erwarten.
40 - 60%	Gemischte Readiness	Nur die regelbasierten Teilprozesse automatisieren. Der Workflow rechtfertigt möglicherweise kein volles Agent-Deployment, profitiert aber von gezielter Automatisierung volumenstarker Typ-R-Entscheidungen.
<40%	Niedrige Agent Readiness	Nicht empfohlen für Agent-Deployment in naher Zukunft. Dieser Workflow ist ermessensintensiv. Zuerst in Prozessdokumentation und Standardisierung investieren.

Typische Scores nach HR-Domäne (basierend auf Praxiserfahrung):

Domäne	Typischer Score	Grund
Payroll & Compensation	85 - 95%	Fast vollständig regelbasiert
Zeiterfassung	80 - 90%	Hohe Regeldichte, wenige Ermessensentscheidungen
Belegverarbeitung	75 - 85%	Regelbasiert mit etwas Dokumentenklassifikation
Onboarding-Administration	60 - 75%	Mix aus regelbasiert und semi-strukturiert
Benefits-Einschreibung	65 - 80%	Regelintensiv, aber mit Anspruchs-Grenzfällen
Recruiting-Screening	40 - 55%	Erhebliches Ermessen bei der Bewertung
Performance Management	20 - 35%	Stark ermessensbasiert
Employee Relations	15 - 30%	Fast ausschließlich Empathie und Ermessen

Schritt 5: Audit-Ergebnis dokumentieren

Das Audit produziert ein strukturiertes Ergebnis, das drei Zwecke erfüllt: Es leitet das Agent-Design (welche Entscheidungen übernimmt der Agent?), es informiert die Betriebsvereinbarung (welche Entscheidungen bleiben beim Menschen?), und es unterstützt die EU-AI-Act-Dokumentationspflicht (warum wurde diese Entscheidung als automatisiert klassifiziert?).

Mindestdokumentation pro Entscheidungspunkt:

Entscheidungspunkt-ID und Beschreibung
Klassifikation (H, R oder A) mit Begründung
Regelquelle (für Typ R): Welches Gesetz, welcher Tarifvertrag oder welche Richtlinie definiert diese Regel? Welche Version?
Konfidenzschwellenwert (für Typ A): Ab welchem Konfidenzlevel entscheidet die KI autonom vs. eskaliert?
Eskalationspfad (für Typ A und Grenzfälle bei Typ R): Wer bearbeitet den Fall wenn der Agent nicht entscheiden kann?
Audit-Trail-Anforderung: Was muss für diese Entscheidung protokolliert werden? (Eingabedaten, angewandte Regel, Ergebnis, Zeitstempel, Agent oder Mensch)

Diese Dokumentation wird zur Spezifikation für die Agent-Konfiguration. Sie ist auch das Artefakt, das der Betriebsrat prüft und der Wirtschaftsprüfer einsieht.

Typische Klassifikationsfehler

Fehler 1: Als R klassifizieren, wenn die Regel Ausnahmen hat die Ermessen erfordern

„Überstunden werden mit 150% vergütet.” Klingt regelbasiert. Aber: Werden Überstunden an einem Feiertag mit 200% vergütet? Was ist mit Überstunden in einer Schicht, die Mitternacht überschreitet und in einen Feiertag hineinreicht? Was wenn der Mitarbeiter einen Individualvertrag hat, der den Tarifvertrag überlagert?

Wenn die Ausnahmen menschliches Ermessen erfordern, ist der Entscheidungspunkt Typ H für den Ausnahmepfad - auch wenn der Standardfall Typ R ist. Der korrekte Ansatz: Den Standardfall als R klassifizieren und einen separaten Entscheidungspunkt für die Ausnahmebehandlung hinzufügen, klassifiziert als H oder A.

Fehler 2: Als A klassifizieren, wenn das KI-Ergebnis nicht überprüfbar ist

„Die KI bewertet, ob der Kandidat kulturell passt.” Das ist nicht Typ A - es gibt keine überprüfbare korrekte Antwort. Kulturelle Passung ist inhärent subjektiv. Typ A erfordert, dass das Ergebnis geprüft werden kann: „Die KI hat dieses Dokument als Krankmeldung klassifiziert” kann von einem Menschen überprüft werden, der dasselbe Dokument betrachtet.

Fehler 3: Die Entscheidung mit der nachgelagerten Aktion verwechseln

„Mustererkennung löst BEM-Prozess aus” - die Erkennung ist Typ R (Schwellenwertberechnung), aber der BEM-Prozess enthält Typ-H-Entscheidungen (Wiedereingliederungsplanung). Das Audit muss die Auslöser-Entscheidung vom ausgelösten Workflow trennen.

Fehler 4: Implizite Entscheidungen ignorieren

„Wir prüfen die Krankmeldung.” Das klingt nach einem Schritt. Aber es enthält mindestens drei Entscheidungen: Ist es ein gültiges Dokument? Ist es vollständig? Passt es zum Mitarbeiter? Jede muss separat klassifiziert werden. Das Audit muss so lange zerlegen, bis jeder Entscheidungspunkt genau eine Frage und eine Klassifikation hat.

Was diese Methodik nicht abdeckt

Dieses Audit bestimmt Agent Readiness auf Entscheidungspunkt-Ebene. Es bestimmt nicht:

Sequenzierung und Priorisierung - welche Workflows zuerst automatisiert werden sollen (das hängt von strategischen Kriterien jenseits der Readiness ab: Transaktionsvolumen, Governance-Komplexität, organisatorische Bereitschaft)
Technologieauswahl - welche KI-Plattform, welches Modell oder welcher Anbieter zu verwenden ist
Organisatorischen Wandel - wie der Übergang für Mitarbeiter gesteuert wird, deren Rollen sich ändern
Betriebsrats-Verhandlungsstrategie - wie der Mitbestimmungsprozess zu strukturieren ist

Dies sind strategische Fragen, die oberhalb des Workflow-Audits liegen. Das Audit liefert die Faktengrundlage für diese Entscheidungen.

Weiterführende Artikel

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.