Zum Inhalt springen
HR & People Operations

Workflow-Audit für Agent Readiness: Methodik

HR-Prozesse in Entscheidungspunkte zerlegen und für Mensch, Regelwerk oder KI klassifizieren. Mit Beispiel und Scoring.

Bert Gogolin
Bert Gogolin
CEO & Gründer 9 Min. Lesezeit

Was diese Methodik leistet

Dieser Artikel beschreibt eine wiederholbare Methode zur Bewertung, ob ein HR-Workflow - oder bestimmte Teile davon - von einem KI-Agenten übernommen werden kann. Die Methode produziert drei Ergebnisse: eine Entscheidungskarte mit jedem einzelnen Entscheidungspunkt im Workflow, eine Klassifikation jedes Entscheidungspunkts nach Typ, und einen Agent-Readiness-Score der quantifiziert, wie viel des Workflows automatisierbar ist.

Die Methodik ist technologie-agnostisch. Sie setzt keine bestimmte KI-Plattform, keinen Anbieter und keinen Technology Stack voraus. Sie funktioniert gleichermaßen für Organisationen, die ihr erstes Agent-Deployment evaluieren, wie für solche, die ein bestehendes auf neue Domänen erweitern.

McKinsey (2024) schätzt, dass 60-70 % der Arbeitstätigkeiten in HR-Abteilungen mit bestehender Technologie teilweise automatisierbar sind. Das Workflow-Audit identifiziert genau welche Teile - Entscheidungspunkt für Entscheidungspunkt.

Auf einen Blick - Workflow-Audit für Agent Readiness

  • Ein Workflow-Audit zerlegt HR-Prozesse in einzelne Entscheidungspunkte und klassifiziert jeden als Mensch, regelbasiert oder KI-geeignet.
  • Das Ergebnis sind drei Deliverables: eine Entscheidungskarte, eine Klassifikation pro Punkt und ein Agent-Readiness-Score, der das Automatisierungspotenzial quantifiziert.
  • Typische HR-Workflows enthalten 10-30 Entscheidungspunkte - die meisten Organisationen unterschätzen diese Zahl erheblich.
  • Die Methodik ist technologie-agnostisch: keine bestimmte KI-Plattform, kein Anbieter und kein Technology Stack wird vorausgesetzt.
  • Ein Workflow-Audit dauert 2-4 Stunden. Eine Organisation kann ihre Top-10-Workflows in etwa zwei Wochen auditieren.

Schritt 1: Workflow-Grenze definieren

Bevor Entscheidungspunkte analysiert werden, muss definiert werden, was der Workflow ein- und ausschließt.

Ein Workflow hat einen Auslöser (was ihn startet), eine Reihe von Verarbeitungsschritten und einen oder mehrere Endpunkte (was als Abschluss gilt). Er hat auch eine Scope-Grenze - wo er mit anderen Workflows interagiert.

Beispiel: Krankmeldungsverarbeitung

  • Auslöser: Mitarbeiter reicht Krankmeldung ein (Papier, E-Mail, Portal-Upload oder Meldung durch Vorgesetzten)
  • Endpunkte: SAP-Datensatz aktualisiert, Vorgesetzter informiert, Payroll angepasst falls erforderlich, Wiedereingliederungs-Aktion geplant falls Schwelle überschritten
  • Scope-Grenze: Dieser Workflow beinhaltet NICHT das Wiedereingliederungsgespräch selbst (das ist ein separater Workflow). Er beinhaltet NICHT den BEM-Prozess - dieser wird durch diesen Workflow ausgelöst, aber separat gesteuert.

Häufiger Fehler: Die Grenze zu weit fassen. „Onboarding” ist nicht ein Workflow - es ist eine Sammlung von 5 - 8 Teil-Workflows (Vertragserstellung, IT-Provisioning, Compliance-Dokumentation, Arbeitsplatzeinrichtung, Schulungsanmeldung, Buddy-Zuordnung, Probezeit-Tracking). Jeden Teil-Workflow separat auditieren.

Schritt 2: Jeden Entscheidungspunkt kartieren

Den Workflow vom Auslöser bis zum Endpunkt durchgehen und jeden Punkt identifizieren, an dem eine Entscheidung getroffen wird. Ein Entscheidungspunkt ist jeder Moment, in dem der Prozess eine Wahl zwischen zwei oder mehr Pfaden auf Basis von Eingabedaten erfordert.

Die meisten Organisationen unterschätzen die Anzahl der Entscheidungspunkte in ihren Prozessen. Der Grund: Erfahrene Mitarbeiter treffen viele Entscheidungen unbewusst. Sie nehmen „prüfen ob die Krankmeldung ein Startdatum hat” nicht als Entscheidung wahr - sie tun es einfach. Aber für einen Agenten ist jede solche Prüfung eine explizite Entscheidung, die spezifiziert werden muss.

Methode: Die „Was könnte schiefgehen”-Technik

Für jeden Schritt im Workflow fragen: „Was könnte hier schiefgehen? Was würde dazu führen, dass dieser Schritt fehlschlägt oder eine andere Aktion erfordert?” Jede Antwort offenbart einen Entscheidungspunkt.

Krankmeldungsverarbeitung - Entscheidungskarte:

#EntscheidungspunktFrage die der Prozess beantwortet
1DokumenteneingangIst dies eine Krankmeldung, ein ärztliches Attest, eine Reha-Bescheinigung oder etwas anderes?
2VollständigkeitsprüfungEnthält das Dokument: Mitarbeitername, Beginn der Diagnoseperiode, Ende der Diagnoseperiode, Arztname, Arztunterschrift?
3MitarbeiteridentifikationWelchem Mitarbeiter gehört dieses Dokument? (Namensabgleich, Personalnummer, Abteilung)
4GesellschaftszuordnungIn welcher Gesellschaft ist dieser Mitarbeiter? (Bestimmt das geltende Regelwerk)
5Tarifvertrags-LookupWelcher Tarifvertrag gilt für diesen Mitarbeiter?
6LohnfortzahlungsanspruchBefindet sich der Mitarbeiter im 6-Wochen-Lohnfortzahlungszeitraum (§ 3 EFZG)? Ist die Wartezeit (§ 3 Abs. 3 EFZG) erfüllt?
7DauerbewertungHandelt es sich um einen einzelnen Tag, eine Kurzabwesenheit (≤3 Tage) oder eine längere Abwesenheit?
8MustererkennungLöst diese Abwesenheit, zusammen mit vorherigen Abwesenheiten, eine Schwelle aus? (z.B. >6 Wochen in 12 Monaten → BEM-Pflicht)
9Payroll-AuswirkungHat diese Abwesenheit Auswirkung auf die Gehaltsabrechnung? (Überstundenstornierung, Schichtzuschlag, Bonusanteilung)
10SystemaktualisierungWas muss in SAP/SuccessFactors aktualisiert werden? (Abwesenheitsdatensatz, Zeitkonto, Payroll-Flag)
11Benachrichtigungs-RoutingWer muss informiert werden? (Vorgesetzter, HR Business Partner, Payroll, Betriebsrat falls BEM ausgelöst)
12Folgeaktion-PlanungIst eine Folgeaktion erforderlich? (Rückkehrdatum, BEM-Einladung, betriebsärztliche Überweisung)

Zwölf Entscheidungspunkte in einem Prozess, den die meisten Organisationen als „Mitarbeiter reicht Krankmeldung ein, wir verarbeiten sie” beschreiben. Die Lücke zwischen wahrgenommener Einfachheit und tatsächlicher Komplexität ist typisch.

Schritt 3: Jeden Entscheidungspunkt klassifizieren

Für jeden Entscheidungspunkt bestimmen, welchem der drei Typen er angehört. Die Klassifikationskriterien müssen streng angewandt werden - der häufigste Fehler ist, eine Entscheidung als „regelbasiert” zu klassifizieren, wenn sie tatsächlich Interpretation erfordert.

Typ H: Mensch entscheidet

Die Entscheidung erfordert eines oder mehrere der folgenden Merkmale:

  • Empathie oder individuelles Ermessen - das Ergebnis hängt davon ab, die spezifische Situation einer Person zu verstehen, nicht davon, eine allgemeine Regel anzuwenden
  • Rechtliches Risiko bei Automatisierung - eine fehlerhafte automatisierte Entscheidung würde erhebliche rechtliche, finanzielle oder Reputationsrisiken erzeugen
  • Mitbestimmungsmandat - der Betriebsrat hat ausdrücklich menschliche Beteiligung für diesen Entscheidungstyp gefordert
  • Ethische Sensibilität - die Entscheidung beinhaltet das Abwägen konkurrierender Interessen, bei denen vernünftige Menschen unterschiedlicher Meinung sein könnten

Testfrage: „Wenn zwei verschiedene erfahrene Fachleute denselben Fall betrachten, würden sie zuverlässig zum selben Ergebnis kommen?” Falls nein - Typ H.

Typ R: Regelbasiert (deterministisch)

Die Entscheidung folgt expliziter Logik, die als eindeutige Wenn-Dann-Aussage formuliert werden kann. Alle folgenden Bedingungen müssen erfüllt sein:

  • Die Regel existiert schriftlich - in einem Gesetz, Tarifvertrag, einer Betriebsvereinbarung oder dokumentierten Verfahrensanweisung
  • Die Eingabedaten sind strukturiert - Namen, Daten, Zahlen, Codes, Kategorien - kein Freitext der Interpretation erfordert
  • Das Ergebnis ist deterministisch - bei gleicher Eingabe produziert die Regel immer dasselbe Ergebnis
  • Es gibt keine Ausnahmen die Ermessen erfordern - oder die Ausnahmen sind selbst regelbasiert („wenn Ausnahme X, dann wende Regel Y an”)

Testfrage: „Könnte ich diese Entscheidung als Formel in einer Tabellenkalkulation schreiben, ohne menschliche Interpretation?” Falls ja - Typ R.

Typ A: KI-geeignet (probabilistisch mit Grenzen)

Die Entscheidung beinhaltet die Verarbeitung unstrukturierter oder semi-strukturierter Information - aber innerhalb definierter Grenzen und mit überprüfbaren Ergebnissen. Alle folgenden Bedingungen müssen erfüllt sein:

  • Die Aufgabe ist Klassifikation, Extraktion oder Abgleich - nicht Erstellung, Bewertung oder Beurteilung
  • Die Grenzen sind definiert - die Menge möglicher Ergebnisse ist bekannt und endlich
  • Das Ergebnis ist überprüfbar - es gibt eine Möglichkeit zu kontrollieren, ob die KI-Entscheidung korrekt war
  • Ein Konfidenzschwellenwert ist setzbar - das System kann Sicherheit ausdrücken, und unsichere Fälle können an einen Menschen eskaliert werden

Testfrage: „Interpretiert dies Information gegen bekannte Kategorien, oder beurteilt es eine einzigartige Situation?” Falls Interpretation gegen Kategorien - Typ A. Falls Beurteilung einer einzigartigen Situation - Typ H.

Angewandt auf unser Krankmeldungs-Beispiel:

#EntscheidungspunktTypBegründung
1DokumentenklassifikationAUnstrukturierte Eingabe (gescanntes Dokument), aber Klassifikation in bekannte Kategorien. Konfidenz-bewertbar.
2VollständigkeitsprüfungAFeldextraktion aus unstrukturiertem Dokument. Bekannte Pflichtfelder. Überprüfbar.
3MitarbeiteridentifikationANamensabgleich gegen Mitarbeiterdatenbank. Kann Fuzzy Matching erfordern. Konfidenz-bewertbar.
4GesellschaftszuordnungRPersonalnummer → Gesellschaft ist deterministisch. Lookup-Tabelle.
5Tarifvertrags-LookupRGesellschaft + Mitarbeiterkategorie → Tarifvertrag. Deterministisch.
6LohnfortzahlungsanspruchRStartdatum + Abwesenheitshistorie + § 3 EFZG Regeln. Reine Berechnung.
7DauerbewertungRKalenderberechnung. Deterministisch.
8MustererkennungRAbwesenheitshistorie + Schwellenwert-Regeln. Deterministisch (obwohl die Reaktion auf eine ausgelöste Schwelle Typ H sein kann).
9Payroll-AuswirkungRAbwesenheitstyp + Dauer + Vergütungsregeln. Deterministisch.
10SystemaktualisierungRBestimmt durch Entscheidungen 4 - 9. Ausführungsschritt.
11Benachrichtigungs-RoutingRRouting-Regeln basierend auf Gesellschaft, Abwesenheitstyp, Schwellenwert-Auslösern. Deterministisch.
12Folgeaktion-PlanungRBasierend auf Dauer, Schwellenwert und Richtlinie. Deterministisch - obwohl die Folgeaktion selbst (z.B. das BEM-Gespräch) Typ H ist.

Ergebnis: 0 Mensch, 8 regelbasiert, 3 KI-geeignet, 1 bedingt (R für die Planung, H für die Folgeaktion selbst).

Schritt 4: Agent-Readiness-Score berechnen

Der Score ist ein einfaches Verhältnis, das quantifiziert, wie viel des Workflows automatisierbar ist.

Formel:

Agent Readiness Score = (Typ R Anzahl + Typ A Anzahl) / Gesamtzahl Entscheidungspunkte × 100

Für unser Krankmeldungs-Beispiel: (8 + 3) / 12 = 91,7%

Dies ist ein hoher Score. Er zeigt, dass fast der gesamte Workflow von einem Agenten übernommen werden kann, mit menschlicher Beteiligung nur für nachgelagerte Aktionen (das BEM-Gespräch, das Wiedereingliederungsgespräch), die separate Workflows sind.

Score-Interpretation:

ScoreInterpretationDeployment-Empfehlung
>80%Hohe Agent ReadinessStarker Kandidat für sofortiges Deployment. Die meisten Entscheidungspunkte sind automatisierbar. Governance-Design auf die wenigen Typ-H-Übergaben fokussieren.
60 - 80%Moderate Agent ReadinessGuter Kandidat für phasenweises Deployment. Typ-R- und Typ-A-Entscheidungen zuerst automatisieren, Typ H manuell belassen. Bedeutsame Human-in-the-Loop-Arbeitslast erwarten.
40 - 60%Gemischte ReadinessNur die regelbasierten Teilprozesse automatisieren. Der Workflow rechtfertigt möglicherweise kein volles Agent-Deployment, profitiert aber von gezielter Automatisierung volumenstarker Typ-R-Entscheidungen.
<40%Niedrige Agent ReadinessNicht empfohlen für Agent-Deployment in naher Zukunft. Dieser Workflow ist ermessensintensiv. Zuerst in Prozessdokumentation und Standardisierung investieren.

Typische Scores nach HR-Domäne (basierend auf Praxiserfahrung):

DomäneTypischer ScoreGrund
Payroll & Compensation85 - 95%Fast vollständig regelbasiert
Zeiterfassung80 - 90%Hohe Regeldichte, wenige Ermessensentscheidungen
Belegverarbeitung75 - 85%Regelbasiert mit etwas Dokumentenklassifikation
Onboarding-Administration60 - 75%Mix aus regelbasiert und semi-strukturiert
Benefits-Einschreibung65 - 80%Regelintensiv, aber mit Anspruchs-Grenzfällen
Recruiting-Screening40 - 55%Erhebliches Ermessen bei der Bewertung
Performance Management20 - 35%Stark ermessensbasiert
Employee Relations15 - 30%Fast ausschließlich Empathie und Ermessen

Schritt 5: Audit-Ergebnis dokumentieren

Das Audit produziert ein strukturiertes Ergebnis, das drei Zwecke erfüllt: Es leitet das Agent-Design (welche Entscheidungen übernimmt der Agent?), es informiert die Betriebsvereinbarung (welche Entscheidungen bleiben beim Menschen?), und es unterstützt die EU-AI-Act-Dokumentationspflicht (warum wurde diese Entscheidung als automatisiert klassifiziert?).

Mindestdokumentation pro Entscheidungspunkt:

  • Entscheidungspunkt-ID und Beschreibung
  • Klassifikation (H, R oder A) mit Begründung
  • Regelquelle (für Typ R): Welches Gesetz, welcher Tarifvertrag oder welche Richtlinie definiert diese Regel? Welche Version?
  • Konfidenzschwellenwert (für Typ A): Ab welchem Konfidenzlevel entscheidet die KI autonom vs. eskaliert?
  • Eskalationspfad (für Typ A und Grenzfälle bei Typ R): Wer bearbeitet den Fall wenn der Agent nicht entscheiden kann?
  • Audit-Trail-Anforderung: Was muss für diese Entscheidung protokolliert werden? (Eingabedaten, angewandte Regel, Ergebnis, Zeitstempel, Agent oder Mensch)

Diese Dokumentation wird zur Spezifikation für die Agent-Konfiguration. Sie ist auch das Artefakt, das der Betriebsrat prüft und der Wirtschaftsprüfer einsieht.

Typische Klassifikationsfehler

Fehler 1: Als R klassifizieren, wenn die Regel Ausnahmen hat die Ermessen erfordern

„Überstunden werden mit 150% vergütet.” Klingt regelbasiert. Aber: Werden Überstunden an einem Feiertag mit 200% vergütet? Was ist mit Überstunden in einer Schicht, die Mitternacht überschreitet und in einen Feiertag hineinreicht? Was wenn der Mitarbeiter einen Individualvertrag hat, der den Tarifvertrag überlagert?

Wenn die Ausnahmen menschliches Ermessen erfordern, ist der Entscheidungspunkt Typ H für den Ausnahmepfad - auch wenn der Standardfall Typ R ist. Der korrekte Ansatz: Den Standardfall als R klassifizieren und einen separaten Entscheidungspunkt für die Ausnahmebehandlung hinzufügen, klassifiziert als H oder A.

Fehler 2: Als A klassifizieren, wenn das KI-Ergebnis nicht überprüfbar ist

„Die KI bewertet, ob der Kandidat kulturell passt.” Das ist nicht Typ A - es gibt keine überprüfbare korrekte Antwort. Kulturelle Passung ist inhärent subjektiv. Typ A erfordert, dass das Ergebnis geprüft werden kann: „Die KI hat dieses Dokument als Krankmeldung klassifiziert” kann von einem Menschen überprüft werden, der dasselbe Dokument betrachtet.

Fehler 3: Die Entscheidung mit der nachgelagerten Aktion verwechseln

„Mustererkennung löst BEM-Prozess aus” - die Erkennung ist Typ R (Schwellenwertberechnung), aber der BEM-Prozess enthält Typ-H-Entscheidungen (Wiedereingliederungsplanung). Das Audit muss die Auslöser-Entscheidung vom ausgelösten Workflow trennen.

Fehler 4: Implizite Entscheidungen ignorieren

„Wir prüfen die Krankmeldung.” Das klingt nach einem Schritt. Aber es enthält mindestens drei Entscheidungen: Ist es ein gültiges Dokument? Ist es vollständig? Passt es zum Mitarbeiter? Jede muss separat klassifiziert werden. Das Audit muss so lange zerlegen, bis jeder Entscheidungspunkt genau eine Frage und eine Klassifikation hat.

Was diese Methodik nicht abdeckt

Dieses Audit bestimmt Agent Readiness auf Entscheidungspunkt-Ebene. Es bestimmt nicht:

  • Sequenzierung und Priorisierung - welche Workflows zuerst automatisiert werden sollen (das hängt von strategischen Kriterien jenseits der Readiness ab: Transaktionsvolumen, Governance-Komplexität, organisatorische Bereitschaft)
  • Technologieauswahl - welche KI-Plattform, welches Modell oder welcher Anbieter zu verwenden ist
  • Organisatorischen Wandel - wie der Übergang für Mitarbeiter gesteuert wird, deren Rollen sich ändern
  • Betriebsrats-Verhandlungsstrategie - wie der Mitbestimmungsprozess zu strukturieren ist

Dies sind strategische Fragen, die oberhalb des Workflow-Audits liegen. Das Audit liefert die Faktengrundlage für diese Entscheidungen.

Weiterführende Artikel

Bert Gogolin

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.

Kein Spam. Jederzeit abbestellbar. Datenschutzerklärung

Workflow Audit Agent Readiness Micro-Entscheidungen HR-Automatisierung Entscheidungsklassifikation
Artikel teilen

Häufige Fragen

Was ist ein Workflow-Audit für Agent Readiness?

Ein Workflow-Audit ist eine strukturierte Analyse, die einen HR-Prozess in seine einzelnen Entscheidungspunkte zerlegt, jeden Entscheidungspunkt nach Typ klassifiziert (Mensch, regelbasiert oder KI-geeignet) und einen Agent-Readiness-Score berechnet. Das Ergebnis ist eine Karte, die genau zeigt, welche Teile eines Workflows automatisiert werden können, welche menschliche Aufsicht erfordern und welche vollständig beim Menschen bleiben müssen.

Wie viele Entscheidungspunkte hat ein typischer HR-Workflow?

Das hängt von der Komplexität ab. Einfache Workflows wie Zeiterfassungs-Validierung haben 4 - 6 Entscheidungspunkte. Krankmeldungsverarbeitung hat 10 - 15. Onboarding hat 20 - 30. Monatliche Payroll für eine Multi-Entity-Organisation kann 40+ haben. Das Audit macht diese Entscheidungspunkte sichtbar - die meisten Unternehmen unterschätzen, wie viele Einzelentscheidungen ihre Prozesse enthalten.

Was ist der Unterschied zwischen einer regelbasierten und einer KI-geeigneten Entscheidung?

Eine regelbasierte Entscheidung folgt deterministischer Logik: wenn Bedingung X, dann Ergebnis Y, ohne Mehrdeutigkeit. Eine KI-geeignete Entscheidung beinhaltet die Interpretation unstrukturierter Information - ein Dokument klassifizieren, Daten aus Freitext extrahieren, eine Beschreibung gegen Kriterien abgleichen - aber innerhalb definierter Grenzen. Beide können automatisiert werden, nutzen aber unterschiedliche technische Ansätze.

Wie lange dauert ein Workflow-Audit?

Ein einzelnes Workflow-Audit dauert typischerweise 2 - 4 Stunden mit den richtigen Teilnehmern: ein Prozessexperte der den Workflow täglich ausführt, ein Fachverantwortlicher der die Geschäftsregeln verantwortet, und eine dokumentierende Person. Eine Organisation kann ihre 10 volumenstärksten Workflows in etwa zwei Wochen auditieren.