Workflow-Audit für Agent Readiness: Methodik
HR-Prozesse in Entscheidungspunkte zerlegen und für Mensch, Regelwerk oder KI klassifizieren. Mit Beispiel und Scoring.
Was diese Methodik leistet
Dieser Artikel beschreibt eine wiederholbare Methode zur Bewertung, ob ein HR-Workflow - oder bestimmte Teile davon - von einem KI-Agenten übernommen werden kann. Die Methode produziert drei Ergebnisse: eine Entscheidungskarte mit jedem einzelnen Entscheidungspunkt im Workflow, eine Klassifikation jedes Entscheidungspunkts nach Typ, und einen Agent-Readiness-Score der quantifiziert, wie viel des Workflows automatisierbar ist.
Die Methodik ist technologie-agnostisch. Sie setzt keine bestimmte KI-Plattform, keinen Anbieter und keinen Technology Stack voraus. Sie funktioniert gleichermaßen für Organisationen, die ihr erstes Agent-Deployment evaluieren, wie für solche, die ein bestehendes auf neue Domänen erweitern.
McKinsey (2024) schätzt, dass 60-70 % der Arbeitstätigkeiten in HR-Abteilungen mit bestehender Technologie teilweise automatisierbar sind. Das Workflow-Audit identifiziert genau welche Teile - Entscheidungspunkt für Entscheidungspunkt.
Auf einen Blick - Workflow-Audit für Agent Readiness
- Ein Workflow-Audit zerlegt HR-Prozesse in einzelne Entscheidungspunkte und klassifiziert jeden als Mensch, regelbasiert oder KI-geeignet.
- Das Ergebnis sind drei Deliverables: eine Entscheidungskarte, eine Klassifikation pro Punkt und ein Agent-Readiness-Score, der das Automatisierungspotenzial quantifiziert.
- Typische HR-Workflows enthalten 10-30 Entscheidungspunkte - die meisten Organisationen unterschätzen diese Zahl erheblich.
- Die Methodik ist technologie-agnostisch: keine bestimmte KI-Plattform, kein Anbieter und kein Technology Stack wird vorausgesetzt.
- Ein Workflow-Audit dauert 2-4 Stunden. Eine Organisation kann ihre Top-10-Workflows in etwa zwei Wochen auditieren.
Schritt 1: Workflow-Grenze definieren
Bevor Entscheidungspunkte analysiert werden, muss definiert werden, was der Workflow ein- und ausschließt.
Ein Workflow hat einen Auslöser (was ihn startet), eine Reihe von Verarbeitungsschritten und einen oder mehrere Endpunkte (was als Abschluss gilt). Er hat auch eine Scope-Grenze - wo er mit anderen Workflows interagiert.
Beispiel: Krankmeldungsverarbeitung
- Auslöser: Mitarbeiter reicht Krankmeldung ein (Papier, E-Mail, Portal-Upload oder Meldung durch Vorgesetzten)
- Endpunkte: SAP-Datensatz aktualisiert, Vorgesetzter informiert, Payroll angepasst falls erforderlich, Wiedereingliederungs-Aktion geplant falls Schwelle überschritten
- Scope-Grenze: Dieser Workflow beinhaltet NICHT das Wiedereingliederungsgespräch selbst (das ist ein separater Workflow). Er beinhaltet NICHT den BEM-Prozess - dieser wird durch diesen Workflow ausgelöst, aber separat gesteuert.
Häufiger Fehler: Die Grenze zu weit fassen. „Onboarding” ist nicht ein Workflow - es ist eine Sammlung von 5 - 8 Teil-Workflows (Vertragserstellung, IT-Provisioning, Compliance-Dokumentation, Arbeitsplatzeinrichtung, Schulungsanmeldung, Buddy-Zuordnung, Probezeit-Tracking). Jeden Teil-Workflow separat auditieren.
Schritt 2: Jeden Entscheidungspunkt kartieren
Den Workflow vom Auslöser bis zum Endpunkt durchgehen und jeden Punkt identifizieren, an dem eine Entscheidung getroffen wird. Ein Entscheidungspunkt ist jeder Moment, in dem der Prozess eine Wahl zwischen zwei oder mehr Pfaden auf Basis von Eingabedaten erfordert.
Die meisten Organisationen unterschätzen die Anzahl der Entscheidungspunkte in ihren Prozessen. Der Grund: Erfahrene Mitarbeiter treffen viele Entscheidungen unbewusst. Sie nehmen „prüfen ob die Krankmeldung ein Startdatum hat” nicht als Entscheidung wahr - sie tun es einfach. Aber für einen Agenten ist jede solche Prüfung eine explizite Entscheidung, die spezifiziert werden muss.
Methode: Die „Was könnte schiefgehen”-Technik
Für jeden Schritt im Workflow fragen: „Was könnte hier schiefgehen? Was würde dazu führen, dass dieser Schritt fehlschlägt oder eine andere Aktion erfordert?” Jede Antwort offenbart einen Entscheidungspunkt.
Krankmeldungsverarbeitung - Entscheidungskarte:
| # | Entscheidungspunkt | Frage die der Prozess beantwortet |
|---|---|---|
| 1 | Dokumenteneingang | Ist dies eine Krankmeldung, ein ärztliches Attest, eine Reha-Bescheinigung oder etwas anderes? |
| 2 | Vollständigkeitsprüfung | Enthält das Dokument: Mitarbeitername, Beginn der Diagnoseperiode, Ende der Diagnoseperiode, Arztname, Arztunterschrift? |
| 3 | Mitarbeiteridentifikation | Welchem Mitarbeiter gehört dieses Dokument? (Namensabgleich, Personalnummer, Abteilung) |
| 4 | Gesellschaftszuordnung | In welcher Gesellschaft ist dieser Mitarbeiter? (Bestimmt das geltende Regelwerk) |
| 5 | Tarifvertrags-Lookup | Welcher Tarifvertrag gilt für diesen Mitarbeiter? |
| 6 | Lohnfortzahlungsanspruch | Befindet sich der Mitarbeiter im 6-Wochen-Lohnfortzahlungszeitraum (§ 3 EFZG)? Ist die Wartezeit (§ 3 Abs. 3 EFZG) erfüllt? |
| 7 | Dauerbewertung | Handelt es sich um einen einzelnen Tag, eine Kurzabwesenheit (≤3 Tage) oder eine längere Abwesenheit? |
| 8 | Mustererkennung | Löst diese Abwesenheit, zusammen mit vorherigen Abwesenheiten, eine Schwelle aus? (z.B. >6 Wochen in 12 Monaten → BEM-Pflicht) |
| 9 | Payroll-Auswirkung | Hat diese Abwesenheit Auswirkung auf die Gehaltsabrechnung? (Überstundenstornierung, Schichtzuschlag, Bonusanteilung) |
| 10 | Systemaktualisierung | Was muss in SAP/SuccessFactors aktualisiert werden? (Abwesenheitsdatensatz, Zeitkonto, Payroll-Flag) |
| 11 | Benachrichtigungs-Routing | Wer muss informiert werden? (Vorgesetzter, HR Business Partner, Payroll, Betriebsrat falls BEM ausgelöst) |
| 12 | Folgeaktion-Planung | Ist eine Folgeaktion erforderlich? (Rückkehrdatum, BEM-Einladung, betriebsärztliche Überweisung) |
Zwölf Entscheidungspunkte in einem Prozess, den die meisten Organisationen als „Mitarbeiter reicht Krankmeldung ein, wir verarbeiten sie” beschreiben. Die Lücke zwischen wahrgenommener Einfachheit und tatsächlicher Komplexität ist typisch.
Schritt 3: Jeden Entscheidungspunkt klassifizieren
Für jeden Entscheidungspunkt bestimmen, welchem der drei Typen er angehört. Die Klassifikationskriterien müssen streng angewandt werden - der häufigste Fehler ist, eine Entscheidung als „regelbasiert” zu klassifizieren, wenn sie tatsächlich Interpretation erfordert.
Typ H: Mensch entscheidet
Die Entscheidung erfordert eines oder mehrere der folgenden Merkmale:
- Empathie oder individuelles Ermessen - das Ergebnis hängt davon ab, die spezifische Situation einer Person zu verstehen, nicht davon, eine allgemeine Regel anzuwenden
- Rechtliches Risiko bei Automatisierung - eine fehlerhafte automatisierte Entscheidung würde erhebliche rechtliche, finanzielle oder Reputationsrisiken erzeugen
- Mitbestimmungsmandat - der Betriebsrat hat ausdrücklich menschliche Beteiligung für diesen Entscheidungstyp gefordert
- Ethische Sensibilität - die Entscheidung beinhaltet das Abwägen konkurrierender Interessen, bei denen vernünftige Menschen unterschiedlicher Meinung sein könnten
Testfrage: „Wenn zwei verschiedene erfahrene Fachleute denselben Fall betrachten, würden sie zuverlässig zum selben Ergebnis kommen?” Falls nein - Typ H.
Typ R: Regelbasiert (deterministisch)
Die Entscheidung folgt expliziter Logik, die als eindeutige Wenn-Dann-Aussage formuliert werden kann. Alle folgenden Bedingungen müssen erfüllt sein:
- Die Regel existiert schriftlich - in einem Gesetz, Tarifvertrag, einer Betriebsvereinbarung oder dokumentierten Verfahrensanweisung
- Die Eingabedaten sind strukturiert - Namen, Daten, Zahlen, Codes, Kategorien - kein Freitext der Interpretation erfordert
- Das Ergebnis ist deterministisch - bei gleicher Eingabe produziert die Regel immer dasselbe Ergebnis
- Es gibt keine Ausnahmen die Ermessen erfordern - oder die Ausnahmen sind selbst regelbasiert („wenn Ausnahme X, dann wende Regel Y an”)
Testfrage: „Könnte ich diese Entscheidung als Formel in einer Tabellenkalkulation schreiben, ohne menschliche Interpretation?” Falls ja - Typ R.
Typ A: KI-geeignet (probabilistisch mit Grenzen)
Die Entscheidung beinhaltet die Verarbeitung unstrukturierter oder semi-strukturierter Information - aber innerhalb definierter Grenzen und mit überprüfbaren Ergebnissen. Alle folgenden Bedingungen müssen erfüllt sein:
- Die Aufgabe ist Klassifikation, Extraktion oder Abgleich - nicht Erstellung, Bewertung oder Beurteilung
- Die Grenzen sind definiert - die Menge möglicher Ergebnisse ist bekannt und endlich
- Das Ergebnis ist überprüfbar - es gibt eine Möglichkeit zu kontrollieren, ob die KI-Entscheidung korrekt war
- Ein Konfidenzschwellenwert ist setzbar - das System kann Sicherheit ausdrücken, und unsichere Fälle können an einen Menschen eskaliert werden
Testfrage: „Interpretiert dies Information gegen bekannte Kategorien, oder beurteilt es eine einzigartige Situation?” Falls Interpretation gegen Kategorien - Typ A. Falls Beurteilung einer einzigartigen Situation - Typ H.
Angewandt auf unser Krankmeldungs-Beispiel:
| # | Entscheidungspunkt | Typ | Begründung |
|---|---|---|---|
| 1 | Dokumentenklassifikation | A | Unstrukturierte Eingabe (gescanntes Dokument), aber Klassifikation in bekannte Kategorien. Konfidenz-bewertbar. |
| 2 | Vollständigkeitsprüfung | A | Feldextraktion aus unstrukturiertem Dokument. Bekannte Pflichtfelder. Überprüfbar. |
| 3 | Mitarbeiteridentifikation | A | Namensabgleich gegen Mitarbeiterdatenbank. Kann Fuzzy Matching erfordern. Konfidenz-bewertbar. |
| 4 | Gesellschaftszuordnung | R | Personalnummer → Gesellschaft ist deterministisch. Lookup-Tabelle. |
| 5 | Tarifvertrags-Lookup | R | Gesellschaft + Mitarbeiterkategorie → Tarifvertrag. Deterministisch. |
| 6 | Lohnfortzahlungsanspruch | R | Startdatum + Abwesenheitshistorie + § 3 EFZG Regeln. Reine Berechnung. |
| 7 | Dauerbewertung | R | Kalenderberechnung. Deterministisch. |
| 8 | Mustererkennung | R | Abwesenheitshistorie + Schwellenwert-Regeln. Deterministisch (obwohl die Reaktion auf eine ausgelöste Schwelle Typ H sein kann). |
| 9 | Payroll-Auswirkung | R | Abwesenheitstyp + Dauer + Vergütungsregeln. Deterministisch. |
| 10 | Systemaktualisierung | R | Bestimmt durch Entscheidungen 4 - 9. Ausführungsschritt. |
| 11 | Benachrichtigungs-Routing | R | Routing-Regeln basierend auf Gesellschaft, Abwesenheitstyp, Schwellenwert-Auslösern. Deterministisch. |
| 12 | Folgeaktion-Planung | R | Basierend auf Dauer, Schwellenwert und Richtlinie. Deterministisch - obwohl die Folgeaktion selbst (z.B. das BEM-Gespräch) Typ H ist. |
Ergebnis: 0 Mensch, 8 regelbasiert, 3 KI-geeignet, 1 bedingt (R für die Planung, H für die Folgeaktion selbst).
Schritt 4: Agent-Readiness-Score berechnen
Der Score ist ein einfaches Verhältnis, das quantifiziert, wie viel des Workflows automatisierbar ist.
Formel:
Agent Readiness Score = (Typ R Anzahl + Typ A Anzahl) / Gesamtzahl Entscheidungspunkte × 100
Für unser Krankmeldungs-Beispiel: (8 + 3) / 12 = 91,7%
Dies ist ein hoher Score. Er zeigt, dass fast der gesamte Workflow von einem Agenten übernommen werden kann, mit menschlicher Beteiligung nur für nachgelagerte Aktionen (das BEM-Gespräch, das Wiedereingliederungsgespräch), die separate Workflows sind.
Score-Interpretation:
| Score | Interpretation | Deployment-Empfehlung |
|---|---|---|
| >80% | Hohe Agent Readiness | Starker Kandidat für sofortiges Deployment. Die meisten Entscheidungspunkte sind automatisierbar. Governance-Design auf die wenigen Typ-H-Übergaben fokussieren. |
| 60 - 80% | Moderate Agent Readiness | Guter Kandidat für phasenweises Deployment. Typ-R- und Typ-A-Entscheidungen zuerst automatisieren, Typ H manuell belassen. Bedeutsame Human-in-the-Loop-Arbeitslast erwarten. |
| 40 - 60% | Gemischte Readiness | Nur die regelbasierten Teilprozesse automatisieren. Der Workflow rechtfertigt möglicherweise kein volles Agent-Deployment, profitiert aber von gezielter Automatisierung volumenstarker Typ-R-Entscheidungen. |
| <40% | Niedrige Agent Readiness | Nicht empfohlen für Agent-Deployment in naher Zukunft. Dieser Workflow ist ermessensintensiv. Zuerst in Prozessdokumentation und Standardisierung investieren. |
Typische Scores nach HR-Domäne (basierend auf Praxiserfahrung):
| Domäne | Typischer Score | Grund |
|---|---|---|
| Payroll & Compensation | 85 - 95% | Fast vollständig regelbasiert |
| Zeiterfassung | 80 - 90% | Hohe Regeldichte, wenige Ermessensentscheidungen |
| Belegverarbeitung | 75 - 85% | Regelbasiert mit etwas Dokumentenklassifikation |
| Onboarding-Administration | 60 - 75% | Mix aus regelbasiert und semi-strukturiert |
| Benefits-Einschreibung | 65 - 80% | Regelintensiv, aber mit Anspruchs-Grenzfällen |
| Recruiting-Screening | 40 - 55% | Erhebliches Ermessen bei der Bewertung |
| Performance Management | 20 - 35% | Stark ermessensbasiert |
| Employee Relations | 15 - 30% | Fast ausschließlich Empathie und Ermessen |
Schritt 5: Audit-Ergebnis dokumentieren
Das Audit produziert ein strukturiertes Ergebnis, das drei Zwecke erfüllt: Es leitet das Agent-Design (welche Entscheidungen übernimmt der Agent?), es informiert die Betriebsvereinbarung (welche Entscheidungen bleiben beim Menschen?), und es unterstützt die EU-AI-Act-Dokumentationspflicht (warum wurde diese Entscheidung als automatisiert klassifiziert?).
Mindestdokumentation pro Entscheidungspunkt:
- Entscheidungspunkt-ID und Beschreibung
- Klassifikation (H, R oder A) mit Begründung
- Regelquelle (für Typ R): Welches Gesetz, welcher Tarifvertrag oder welche Richtlinie definiert diese Regel? Welche Version?
- Konfidenzschwellenwert (für Typ A): Ab welchem Konfidenzlevel entscheidet die KI autonom vs. eskaliert?
- Eskalationspfad (für Typ A und Grenzfälle bei Typ R): Wer bearbeitet den Fall wenn der Agent nicht entscheiden kann?
- Audit-Trail-Anforderung: Was muss für diese Entscheidung protokolliert werden? (Eingabedaten, angewandte Regel, Ergebnis, Zeitstempel, Agent oder Mensch)
Diese Dokumentation wird zur Spezifikation für die Agent-Konfiguration. Sie ist auch das Artefakt, das der Betriebsrat prüft und der Wirtschaftsprüfer einsieht.
Typische Klassifikationsfehler
Fehler 1: Als R klassifizieren, wenn die Regel Ausnahmen hat die Ermessen erfordern
„Überstunden werden mit 150% vergütet.” Klingt regelbasiert. Aber: Werden Überstunden an einem Feiertag mit 200% vergütet? Was ist mit Überstunden in einer Schicht, die Mitternacht überschreitet und in einen Feiertag hineinreicht? Was wenn der Mitarbeiter einen Individualvertrag hat, der den Tarifvertrag überlagert?
Wenn die Ausnahmen menschliches Ermessen erfordern, ist der Entscheidungspunkt Typ H für den Ausnahmepfad - auch wenn der Standardfall Typ R ist. Der korrekte Ansatz: Den Standardfall als R klassifizieren und einen separaten Entscheidungspunkt für die Ausnahmebehandlung hinzufügen, klassifiziert als H oder A.
Fehler 2: Als A klassifizieren, wenn das KI-Ergebnis nicht überprüfbar ist
„Die KI bewertet, ob der Kandidat kulturell passt.” Das ist nicht Typ A - es gibt keine überprüfbare korrekte Antwort. Kulturelle Passung ist inhärent subjektiv. Typ A erfordert, dass das Ergebnis geprüft werden kann: „Die KI hat dieses Dokument als Krankmeldung klassifiziert” kann von einem Menschen überprüft werden, der dasselbe Dokument betrachtet.
Fehler 3: Die Entscheidung mit der nachgelagerten Aktion verwechseln
„Mustererkennung löst BEM-Prozess aus” - die Erkennung ist Typ R (Schwellenwertberechnung), aber der BEM-Prozess enthält Typ-H-Entscheidungen (Wiedereingliederungsplanung). Das Audit muss die Auslöser-Entscheidung vom ausgelösten Workflow trennen.
Fehler 4: Implizite Entscheidungen ignorieren
„Wir prüfen die Krankmeldung.” Das klingt nach einem Schritt. Aber es enthält mindestens drei Entscheidungen: Ist es ein gültiges Dokument? Ist es vollständig? Passt es zum Mitarbeiter? Jede muss separat klassifiziert werden. Das Audit muss so lange zerlegen, bis jeder Entscheidungspunkt genau eine Frage und eine Klassifikation hat.
Was diese Methodik nicht abdeckt
Dieses Audit bestimmt Agent Readiness auf Entscheidungspunkt-Ebene. Es bestimmt nicht:
- Sequenzierung und Priorisierung - welche Workflows zuerst automatisiert werden sollen (das hängt von strategischen Kriterien jenseits der Readiness ab: Transaktionsvolumen, Governance-Komplexität, organisatorische Bereitschaft)
- Technologieauswahl - welche KI-Plattform, welches Modell oder welcher Anbieter zu verwenden ist
- Organisatorischen Wandel - wie der Übergang für Mitarbeiter gesteuert wird, deren Rollen sich ändern
- Betriebsrats-Verhandlungsstrategie - wie der Mitbestimmungsprozess zu strukturieren ist
Dies sind strategische Fragen, die oberhalb des Workflow-Audits liegen. Das Audit liefert die Faktengrundlage für diese Entscheidungen.
Weiterführende Artikel

Bert Gogolin
Geschäftsführer, Gosign
AI Governance Briefing
Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.