Wann ist Mistral die richtige Wahl gegenüber Claude oder GPT-5?

Mistral ist der Arbeitspferd-Layer für rund 70 % der agentischen Entscheidungen, wenn der Agent sauber zerlegt ist: Regelanwendung, strukturierte Extraktion, Klassifikation. Claude Opus 4.7 oder GPT-5.5 bleiben für die 8 bis 10 % mit echter Reasoning-Last. Die Frage ist nicht welches Modell das beste ist, sondern welches Modell für welche Mikro-Entscheidung.

Was ist gpt-oss und worin unterscheidet es sich von Mistral?

gpt-oss-120b ist OpenAIs erstes Open-Weight-Modell seit GPT-2, veröffentlicht am 5. August 2025 unter Apache 2.0. Es erreicht Reasoning auf o4-mini-Niveau auf einer einzelnen 80-GB-GPU. Gegenüber Mistral Small 3.2 (24B Parameter, läuft auf einer Consumer-GPU) zielt gpt-oss-120b auf die schwereren Reasoning-Workloads. Beide sind legitime Self-Hosting-Optionen für EU-Datensouveränität.

Wie erfüllt Decision Routing EU AI Act Artikel 13?

Artikel 13 verlangt, dass Hochrisiko-KI-Systeme so transparent betrieben werden, dass Betreiber die Ausgaben interpretieren können. Eine Decision-Routing-Schicht erzwingt das technisch: Jede Entscheidung wird mit Input, Regelversion, eingesetztem Modell, Confidence-Score (bei KI), Reasoning-Chain (sofern relevant) und menschlichem Prüfer (bei Eskalation) protokolliert. Der Audit-Trail ist das Artikel-13-Compliance-Artefakt.

Wann Mistral, wann Claude Opus? Decision Routing für agentische EU-Enterprise 2026

Q: Ist Mistral wirklich EU-souverän?

Mistral La Plateforme wird standardmäßig in der EU auf französischer Infrastruktur gehostet. Ab Q2 2026 betreibt das Unternehmen ein eigenes Rechenzentrum in Bruyères-le-Châtel südlich von Paris mit 13.800 NVIDIA GB300 GPUs und 44 Megawatt Kapazität. Mistral Small 3.2 steht unter Apache-2.0-Lizenz und läuft vollständig self-hosted auf einer einzelnen RTX 4090. Beide Optionen liegen außerhalb der Reichweite des US CLOUD Act - anders als Azure OpenAI EU.

Der Modellmarkt ist schneller reif geworden als die meisten Enterprise-Architekturen. Claude Opus 4.7, GPT-5.5 und Gemini 3.1 Pro konvergieren in der Qualität. Mistral La Plateforme betreibt seine Inferenz aus einem französischen Rechenzentrum unter EU-Recht. OpenAI hat im August 2025 gpt-oss unter Apache 2.0 veröffentlicht. Meta und Mistral liefern Open-Weight-Modelle, die auf einer einzelnen GPU produktiv laufen.

Und trotzdem entscheiden sich die meisten Enterprise-KI-Projekte für ein einzelnes Modell und routen jeden Workload dort durch. Diese Wahl bestimmt still mit: die Cloud-Souveränitäts-Position, die Audit-Kosten unter dem EU AI Act und den Spielraum für Kostenoptimierung. Ein Modell zu wählen ist keine Modell-Entscheidung. Es ist eine Architektur-Entscheidung.

Auf einen Blick - Agentischer KI-Stack für EU-Enterprise 2026

Rund 70 % der agentischen Entscheidungen in einem sauber zerlegten Enterprise-Workflow sind Regelanwendung oder strukturierte Extraktion. In typischen EU-Hosting-Setups erledigt Mistral Small 3.2 auf einer einzelnen GPU diese Last zu etwa 1/30 des Claude-Opus-Listenpreises.
Mistral hat zwei klar getrennte Deployment-Flächen: La Plateforme (EU-gehosteter API-Endpunkt, französische Infrastruktur, ab Q2 2026 eigenes Rechenzentrum Bruyères-le-Châtel) und Mistral Small 3.2 (Apache 2.0, vollständig self-hostbar, 24B Parameter).
Die verbleibenden 8 bis 10 % der Entscheidungen - komplexes Reasoning, jurisdiktionsübergreifende Analyse, Edge-Case-Eskalation - rechtfertigen Claude Opus 4.7 oder GPT-5.5. Dort werden Token-Kosten verdient, nicht verschwendet.
Die Exponiertheit gegenüber dem US CLOUD Act gilt auch für EU-Region-Deployments US-amerikanischer Anbieter. Schrems II hat das konkret gemacht. Self-Hosted-Optionen wie Mistral Small, gpt-oss-120b oder DeepSeek V4-Flash (April-2026-Preview, MIT, 284B/13B Aktiv-MoE) sind die einzigen Architekturen mit Null-CLOUD-Act-Fläche.
EU AI Act Artikel 13 verlangt transparenten Betrieb von Hochrisiko-Systemen. Eine Decision-Routing-Schicht erzeugt das Audit-Artefakt: pro Entscheidung ein Record mit Input, Regelversion, Modell, Confidence und menschlichem Prüfer, sobald eskaliert wurde.

Sie evaluieren Mistral - was Sie eigentlich evaluieren ist Ihre EU-Cloud-Strategie

Ein typischer Suchverlauf 2026 sieht so aus: Compliance fragt nach einer EU-Alternative zu OpenAI. Procurement sammelt Vendor-Pitches. Architecture beginnt mit der Mistral-Evaluation. Innerhalb einer Woche hat sich das Gespräch von “welches Modell” zu “wie steht es um die CLOUD-Act-Exposition” und “wie operationalisieren wir EU AI Act Artikel 13 für Hochrisiko-Systeme” verschoben.

Der CLOUD Act folgt der Provider-Kontrolle, nicht dem Datenstandort. Ein US-Anbieter mit EU-Rechenzentren - Azure OpenAI EU, AWS Bedrock Frankfurt, GCP Vertex europe-west - kann weiterhin per US-Anordnung zur Datenherausgabe verpflichtet werden. Die Europäische Kommission wird in Q2 2026 voraussichtlich ein Tech Sovereignty Package vorlegen, das den öffentlichen Sektor bei sensiblen Workloads in Gesundheit, Finanzwesen und Justiz auf nicht-US-Anbieter verpflichtet. Der private Sektor liest diese Signale mit.

Mistral interessiert nicht, weil es Claude auf einer Bestenliste schlägt. Es interessiert, weil es eine Position einnimmt, die kein US-Anbieter besetzen kann: ein Frontier-Class-Anbieter aus Europa mit eigener EU-Infrastruktur und vollständig offener Modellreihe unter Apache 2.0. Ab Q2 2026 betreibt das Unternehmen ein eigenes Rechenzentrum bei Paris mit 13.800 NVIDIA GB300 GPUs und 44 Megawatt Kapazität. Damit ist Mistral der einzige Frontier-Anbieter, der End-to-End-EU-Residenz auf Infrastruktur unter EU-Recht garantieren kann.

Aber das fasst die Frage falsch. Die eigentliche Frage ist nicht “Mistral oder OpenAI”. Sie lautet “welche Entscheidungen gehen wohin, und wie weisen Sie das einem Prüfer nach”.

Mistral sind zwei Welten: La Plateforme in Frankreich oder Mistral Small unter Apache 2.0

Die Verwirrung beginnt, wenn “Mistral” als ein Produkt behandelt wird. Es sind zwei Produktfamilien mit unterschiedlichen Deployment-Flächen und unterschiedlichen Compliance-Konsequenzen.

Mistral-Produkt	Deployment	Lizenz / Kosten	EU-souverän
Mistral Medium 3.1	La Plateforme (FR-gehosteter API) oder Azure AI Foundry	Token-basiert, proprietär	Ja via La Plateforme
Mistral Small 3.2	Self-hosted on-prem	Apache 2.0, nur GPU-Kosten	Ja bei EU-Hardware
Mixtral 8x22B	Self-hosted on-prem	Apache 2.0, nur GPU-Kosten	Ja bei EU-Hardware
Codestral	La Plateforme	Token-basiert, proprietär	Ja via La Plateforme

“EU-souverän” heißt hier: außerhalb der Reichweite des US CLOUD Act. Sowohl La Plateforme (französische Jurisdiktion) als auch Self-Hosting auf EU-Hardware qualifizieren sich. Azure AI Foundry nicht - auch nicht mit EU-Datenresidenz, weil Microsoft weiterhin CLOUD-Act-pflichtig ist.

Mistral Medium 3.1 ist das proprietäre Frontier-Class-Flaggschiff. Es läuft auf Mistrals eigener französischer Infrastruktur, erreichbar via API. Token-abgerechnet. EU-souverän by default. Ab Q2 2026 übernimmt das eigene Rechenzentrum Bruyères-le-Châtel die Inferenz für Kunden mit französischem Residenz-Erfordernis.

Mistral Small 3.2 ist das Open-Weight-Arbeitspferd. 24 Milliarden Parameter. 128K Token Kontext. Vision-Fähigkeit nativ enthalten. Veröffentlicht 2025 unter Apache 2.0. Läuft auf einer einzelnen NVIDIA RTX 4090 oder einem Mac mit 32 GB RAM. Durchsatz rund 150 Token pro Sekunde auf Consumer-Hardware.

Die beiden sind nicht redundant. La Plateforme ist sinnvoll, wenn Sie EU-Souveränität wollen, ohne GPU-Infrastruktur zu betreiben. Mistral Small 3.2 ist sinnvoll, wenn die Entscheidung so hochvolumig ist, dass Token-Billing zum Kostentreiber wird - oder wenn die Daten so sensibel sind, dass selbst EU-API-Traffic zu viel Fläche bedeutet.

Die Architektur-Frage lautet welche Deployment-Fläche für welche Entscheidung - nicht welcher Anbieter für welche Bestenliste.

Modell-Profil auf sechs Enterprise-Dimensionen - die c't-typische Vergleichsansicht, jeweils mit Skala 0 bis 10. Cloud-Flaggschiffe (Claude Opus 4.7, GPT-5.5) dominieren bei Reasoning, Coding, Multimodal, verlieren aber bei Kosten-Effizienz und EU-Souveränität. Self-hostbare Modelle (Mistral Small 3.2, DeepSeek V4-Pro) invertieren diese Form. Es gibt kein einzelnes "bestes" Modell - die Routing-Schicht wählt die richtige Form pro Mikro-Entscheidung.

Warum Mistral Small als Default, nicht gpt-oss oder DeepSeek

Eine berechtigte Frage, sobald Self-Hosting beschlossen ist: Warum gewinnt Mistral Small 3.2 den Arbeitspferd-Slot gegenüber gpt-oss-120b (Apache 2.0, 117B Parameter MoE, 5. August 2025) oder DeepSeek V4 (MIT, Preview vom 24. April 2026; V4-Flash 284B/13B aktiv, V4-Pro 1,6T/49B aktiv, 1M Kontext)? Alle drei sind in irgendeiner Konfiguration self-hostbar. Die Differenzierung liegt bei Hardware-Floor, Sprachabdeckung und Modalität.

Open-Source-Modell	Hardware-Floor	Stärke	Schwäche	Sweet Spot
Mistral Small 3.2 (24B, Apache 2.0)	1x RTX 4090 (~1.500 EUR einmalig) oder Mac M2/M3 32GB	Volumen, multilingual (DE/EN/PL/ES/BR), Vision-fähig, ~150 Token/s	Kein Top-Tier-Reasoning	Default-Arbeitspferd für die 70-%-Volumen-Bandbreite
gpt-oss-120b (117B MoE, Apache 2.0)	1x H100/A100 80GB (~30.000 EUR oder ~1.200 EUR/Monat gehostet)	Reasoning auf o4-mini-Niveau, MoE-effizient	Keine Vision, Datacenter-Hardware nötig	Heavy-Reasoning-Alternative zu Claude Opus, wenn auch das on-prem bleiben muss
DeepSeek V4-Flash (MIT, Apr-2026-Preview)	1-2x H100/A100 80GB mit Quant (~30-60k EUR CAPEX oder ~1.500-5.000 EUR/Monat gehostet); 4x H100 für volle Präzision	Frontier-Reasoning bei moderater Hardware, 1M Kontext, nativ multimodal	Preview-Status - Benchmarks vor Produktion neu prüfen	Math/Logik-Spezialist + 1M-Kontext für Portfolio-Analyse
DeepSeek V4-Pro (MIT, Apr-2026-Preview)	8x H100 Cluster (~240.000 EUR CAPEX oder ~10.000-12.000 EUR/Monat gehostet)	Nähert sich GPT-5.5/Gemini 3.1 Pro an, Agent-Tool-optimiert	DAX-Konzern absolut machbar, gehobener Mittelstand budget-fit, KMU via API/hosted (Together.ai, Fireworks, DeepSeek API)	Frontier-Reasoning unter offener Lizenz - on-prem für Konzern, API für KMU
Llama 4 Scout (Meta Llama License)	1x GPU	10M Token Kontext	Lizenzschranke ab 700M MAU	Ultra-Long-Context für komplette Vertragsportfolios

Drei konkrete Gründe, warum Mistral Small den Default-Slot bekommt:

Hardware-Schwelle. Mistral Small läuft auf Consumer-Hardware. gpt-oss-120b braucht eine Datacenter-GPU. Bei einer Enterprise-Pipeline mit fünf bis zehn Worker-Knoten ist der Hardware-Aufschlag pro Knoten erheblich. Wenn 70 % der Entscheidungen Klassifikation oder Extraktion sind, ist gpt-oss-Reasoning-Kapazität für die Volumen-Arbeit überdimensioniert.

Multilinguales Trainingskorpus. Mistral wurde von Beginn an auf Französisch, Deutsch, Spanisch und Italienisch trainiert. gpt-oss ist US-zentrisch mit englisch-dominantem Trainingsmaterial. Für eine EU-Enterprise-Pipeline, die polnische, spanische oder portugiesische Dokumente verarbeitet, ist Mistral Small ab Tag eins das bessere Arbeitspferd.

Vision nativ enthalten. Mistral Small 3.2 hat eine integrierte Vision-Fähigkeit. gpt-oss nicht. Für HR-Onboarding (Pass-Scans, Bescheinigungen, ELStAM-Formulare) oder Belegverarbeitung (PDF-Rechnungen mit Layout) ist das ein hartes K.-o.-Kriterium.

gpt-oss-120b oder DeepSeek V4-Flash kommen on-prem ins Spiel als Heavy-Reasoning-Optionen, wenn Claude Opus 4.7 via API aus Compliance-Gründen nicht eingesetzt werden kann. DeepSeek V4-Pro nähert sich der Frontier-Closed-Source-Leistung unter MIT-Lizenz; für DAX-Konzerne und gehobenen Mittelstand ist der 8x-H100-Cluster (~240.000 EUR CAPEX oder ~10.000-12.000 EUR/Monat gehostet) eine Standard-IT-Budget-Position, für KMU unter 500 Mitarbeitenden ist der realistische Weg API/hosted (Together.ai, Fireworks, DeepSeek API). Keines ersetzt Mistral Small als Volumen-Arbeitspferd - sie ergänzen es für die schwereren Entscheidungen. Den ausführlichen Self-Hosting-Vergleich behandelt Selbstgehostete Open-Source-KI 2026: Mistral, gpt-oss, DeepSeek V4, Llama 4 im Enterprise-Stack (separater Artikel).

Welches Modell für was? Die Komplexitätsverteilung agentischer Entscheidungen

Ein typischer Enterprise-Agent zerfällt in 14 bis 50 Mikro-Entscheidungen. Die Komplexität ist nicht gleichmäßig verteilt. In einer gut instrumentierten HR- oder Finance-Pipeline folgt sie einem Muster, das wir konsistent messen:

Entscheidungstyp	Anteil	Komplexität	Bestes Modell	Tatsächliche Kosten pro 1M Token
Regelanwendung (Steuerklasse aus Stammdaten, Vertragstyp-Klassifikation, Schwellenwert-Prüfungen)	50 %	Niedrig	Oft kein LLM nötig; sonst Mistral Small 3.2, Llama 4 Scout, gpt-oss-20b	~0 bis ~0,50 USD
Strukturierte Extraktion (Felder aus PDFs, Tabellen normalisieren, OCR-korrigierte Positionsdaten)	25 %	Mittel	Mistral Small 3.2, Mistral Medium 3.1, gpt-oss-120b	~0,50 bis ~2 USD
Kontextuelle Klassifikation (BetrVG-§87-Klauseln, Anomalien in Spesenabrechnungen, Lieferanten-Risikoflags)	15 %	Mittel-hoch	Mistral Medium 3.1, Claude Haiku 4.5, GPT-5 mini	~1 bis ~5 USD
Komplexes Reasoning (Anti-Diskriminierungs-Pruefung nach AGG inkl. Beweislastumkehr-Risiko, mehrstufige Argumentkette ueber Jurisdiktionen, Eskalations-Entwurf)	8 %	Hoch	Claude Opus 4.7, GPT-5.5	~15 bis ~25 USD
Multimodal (Bild + Text korreliert, Video-Segmente, technische Zeichnungen)	2 %	Hoch	Gemini 3.1 Pro	~5 bis ~10 USD

Die Konsequenz ist eindeutig. Wer jede Entscheidung durch Claude Opus routet, zahlt Flaggschiff-Token-Tarife für die 75 % der Arbeit, die kein Flaggschiff-Reasoning braucht. Wer jede Entscheidung durch Mistral Small routet, spart Token-Kosten, scheitert aber an den 8 % mit echtem Reasoning-Bedarf - und zahlt den Preis in Prüfungsfeststellungen, nicht in Token.

Der Stanford-HAI-AI-Index 2025 verzeichnet, dass 65,7 % der 2023 neu veröffentlichten Foundation-Modelle Open-Source waren - 2021 waren es noch 33,3 %. Die Enterprise-KI-Adoption hat 78 % überschritten. Der Markt entscheidet nicht mehr zwischen proprietär und offen. Er entscheidet, wie er sie kombiniert.

Mistral Small als Arbeitspferd: ein HR-Onboarding-Agent mit 14 Mikro-Entscheidungen

Konkretes Beispiel. Ein HR-Onboarding-Agent erhält den unterschriebenen Vertrag eines neuen Mitarbeitenden plus Begleitdokumente (Pass-Kopie, ELStAM-Daten, Bankverbindung, Qualifikationsnachweise). Aufgabe: Stammsatz erzeugen, Pre-Employment-Compliance-Checks fahren, Onboarding terminieren, DEÜV-Meldung nach § 28a SGB IV anstoßen. 14 Mikro-Entscheidungen insgesamt, von Regex-Validierung bis AGG-Analyse. Der Agent fällt unter EU AI Act Annex III Punkt 4 (Beschäftigung, Personalmanagement) - daraus folgen die Art. 9 (Risk Management System), Art. 13 (Transparenz) und Art. 14 (Menschliche Aufsicht) Pflichten.

Eine naive Implementierung schickt jeden Schritt durch Claude Opus 4.7. Eine zerlegte Implementierung routet pro Schritt. Der Decision Layer hält die Routing-Regeln: Jeder Schritt ist vor Ausführung als REGELWERK, KI AUTONOM oder MENSCH klassifiziert.

REGELWERK: Die Entscheidung ist deterministisch. Die deutsche Steuer-ID folgt einer Prüfziffer, die IBAN folgt ISO 13616. Keine Interpretation, kein Modell nötig. Hier ist der Agent Executor, nicht Reasoner.

KI AUTONOM: Die Entscheidung ist Klassifikation oder Extraktion mit ausreichender Konfidenz. Dokumenttyp-Erkennung, Vertragsart-Klassifikation, strukturierte Feldextraktion. Ein kleines Modell mit klarem Schema schlägt ein Flaggschiff mit vagem Prompt.

MENSCH: Die Entscheidung berührt Ermessen, Diskriminierungsrisiko, Mitbestimmungs-Scope oder Schwellenwertverletzungen. AGG-Diskriminierungsmerkmale (§ 1) i.V.m. § 7 Benachteiligungsverbot mit § 22 Beweislastumkehr und § 15 Schadensersatz bis 3 Brutto-Monatsgehälter, Mitbestimmung nach § 99 BetrVG bei personellen Einzelmaßnahmen (Zustimmungsverfahren des Betriebsrats, nicht Anzeigepflicht), Gehaltsanomalie über der vereinbarten Grenze. Das Modell bereitet den Fall vor; der Mensch unterschreibt die Entscheidung.

Die folgenden acht Schritte sind ein repräsentatives Routing-Muster aus einer typischen 14-Schritt-Pipeline. Die vollständige Routing-Tabelle aller 14 Schritte liegt in der Decision-Layer-Konfiguration des Kunden.

Schritt	Entscheidung	Layer	Routing-Ziel
1	Dokumenttypen im Upload erkennen	KI AUTONOM	Mistral Small 3.2 on-prem
2	Personendaten extrahieren (Name, Adresse, Geburtsdatum, Steuer-ID)	KI AUTONOM	Mistral Small 3.2 on-prem
3	Steuer-ID-Format validieren (DE ELStAM nach §39e EStG, IBAN nach ISO 13616)	REGELWERK	Regel-Engine, kein LLM
4	Vertragstyp klassifizieren (befristet, unbefristet, Probezeit)	KI AUTONOM	Mistral Small 3.2
5	Vertragsklauseln gegen Betriebsvereinbarung v2024-3 prüfen	KI AUTONOM	Mistral Medium 3.1 (La Plateforme)
6	Klauseln auf Diskriminierungsrisiko nach AGG (§ 1 Merkmale, § 7 Benachteiligungsverbot, § 22 Beweislastumkehr, § 15 Schadensersatz) markieren	MENSCH (KI bereitet vor)	Claude Opus 4.7 entwirft die Analyse, HR-Manager unterschreibt
7	Gehaltsanomalien nach Rolle/Standort/Senioritätsstufe erkennen	KI AUTONOM	Mistral Medium 3.1
8	Entscheiden ob Zustimmungsverfahren nach § 99 BetrVG (personelle Einzelmaßnahme) eingeleitet werden muss	MENSCH (KI bereitet vor)	Mistral Medium 3.1 vor-klassifiziert, Betriebsrats-Kontakt unterschreibt

Von den 14 Gesamtschritten sind sechs REGELWERK (kein LLM nötig: IBAN-Check, Vollständigkeits-Checks, deterministische Registrierungsmeldungen). Sechs sind KI AUTONOM (Mistral Small oder Medium). Zwei sind MENSCH mit KI-Vorbereitung (Claude Opus für die Anti-Diskriminierungs-Pruefung nach AGG, Mistral Medium für die Vorklassifikation, ob das Zustimmungsverfahren nach § 99 BetrVG einzuleiten ist).

In typischen EU-Hosting-Setups liegen die Inferenzkosten pro Onboarding bei rund 1 bis 3 USD. Eine reine Flaggschiff-Architektur (jeder Schritt durch Claude Opus) landet eher bei 25 bis 40 USD pro Onboarding - und verarbeitet Schritt 1 und 2 auf US-Infrastruktur unter CLOUD-Act-Exposition. Gleiches Geschäftsergebnis. Anderer Audit-Trail. Andere Kostenkurve. Andere Souveränitäts-Position.

Was der Prüfer sieht: Decision Records nach EU AI Act Artikel 13

EU AI Act Artikel 13 verlangt, dass Hochrisiko-KI-Systeme so transparent betrieben werden, dass Betreiber die Ausgaben angemessen interpretieren und verwenden können. Das System muss mit Anweisungen zu Genauigkeitsmetriken, Robustheit, getesteter Cybersecurity-Stufe, menschlicher Aufsicht nach Artikel 14 und erforderlichen Hardware-Ressourcen ausgeliefert werden.

Für BaFin-regulierte Institute koppeln sich an Art. 13 die Pflichten aus § 25b KWG und MaRisk AT 9 (Auslagerung): wesentliche Auslagerung an Mistral La Plateforme löst Meldepflicht nach § 24 Abs. 1 Nr. 16 KWG aus. DORA Art. 28-30 verlangt seit 17. Januar 2025 zusätzlich Eintrag im ICT-Drittparteien-Register. EBA Guidelines on Outsourcing (EBA/GL/2019/02) gelten ergänzend. Decision Records erfüllen die Dokumentations-Pflicht in allen drei Frameworks parallel.

Für den Bilanzprüfer ist Art. 13 nur ein Anker. GoBD 2025 Rz. 156-176 verlangen dokumentierte Interne Kontrollverfahren bei elektronischer Verarbeitung mit 10-Jahres-Aufbewahrungspflicht nach § 147 AO. IDW PS 951 (Internes Kontrollsystem) und IDW PS 980 (Compliance-Management-System) sind die Prüf-Standards, gegen die der Konzernabschlussprüfer mit KI-Komponente arbeitet.

Die Frage des Wirtschaftsprüfers am Prüfungstag lautet nicht “welches Modell habt Ihr eingesetzt”, sondern “zeigen Sie mir den Decision Record für Personalfall 2026-01-1873, Schritt 8”.

Ein Decision Record aus einer Routing-Schicht enthält pro Mikro-Entscheidung:

Input-Snapshot (die relevanten Felder aus dem Upstream-Kontext, mit PII-Behandlung)
Regelversion (welche Version der Betriebsvereinbarung galt; v2024-3)
Entscheidungstyp (Regelanwendung, KI-Klassifikation, KI-Reasoning, menschliche Freigabe)
Eingesetztes Modell (bei KI: Mistral-Small-3.2-Instruct, deployed auf Cluster A04, Region eu-de-fra)
Confidence-Score (bei KI: 0,94)
Reasoning-Chain (falls relevant: die Zwischen-Reasoning-Schritte des Modells, wörtlich)
Ergebnis (Klassifikationslabel, extrahierter Wert oder Eskalations-Flag)
Menschlicher Prüfer (bei Eskalation: Name, Rolle, Zeitstempel)
Anfechten-Button für KI-Entscheidungen (die betroffene Person kann eine automatisierte Entscheidung anfechten und löst damit eine erneute Entscheidung unter menschlicher Prüfung aus - der von DSGVO Art. 22 verlangte Mechanismus)

Eine Pipeline, die diese Records produziert, macht aus der Modellfrage eine Routing-Frage. Der Prüfer fragt nicht “ist Mistral so gut wie Claude”. Er fragt “ist die Entscheidung End-to-End dokumentiert und reproduzierbar”. Die Aufsichtsrats-Frage geht einen Schritt weiter: Wer unterschreibt eine Entscheidung, in der eine diskriminierende Vertragsklausel (AGG-Verstoss) durchgerutscht ist, weil ein Routing-Ziel an einen Menschen hätte eskalieren müssen? Die Routing-Schicht macht diese Unterschrift nachweisbar.

Die Architektur-Frage: Decision Layer oder Vendor Lock-in

Ein modell-agnostischer Decision Layer ist kein Feature. Er ist die Vorbedingung für fast alles andere in diesem Artikel. Ohne ihn bleiben die Routing-Muster oben abstrakt.

Ohne Decision Layer	Mit Decision Layer
Die Modellwahl ist klebrig. Provider-Wechsel bedeutet, den Agenten neu zu bauen.	Provider-Wechsel ist eine Konfigurationsänderung. Modelle sind pro Entscheidungsschritt austauschbar.
Kostenoptimierung passiert im Nachhinein, in Verhandlungen mit einem einzelnen Anbieter.	Kostenoptimierung ist eingebaut: Entscheidungen niedriger Komplexität routen automatisch an das günstigste valide Modell.
Souveränität ist binär: entweder CLOUD-Act-Exposition akzeptieren oder alles self-hosten.	Souveränität ist pro Entscheidung: sensible Schritte laufen EU-on-prem, unsensible dürfen Cloud-APIs nutzen.
Audit-Trail existiert in verstreuten Logs und wird on demand rekonstruiert.	Audit-Trail IST das Routing-Log. EU-AI-Act-Artikel-13-Compliance ist eine Datenbankabfrage, kein Projekt.
Ein neues Modell heißt eine neue Integration.	Ein neues Modell heißt ein neuer Eintrag im Router. Routing-Regeln existieren bereits.

Diese Tabelle zeigt architektonische Unterschiede, keine Qualitätsurteile.

Der Decision Layer ist der Ort, an dem die Modellwahl operationalisiert wird. Der Modellmarkt verändert sich monatlich. Preise fallen. Neue Flaggschiffe erscheinen. Open-Weight-Qualität holt auf. Eine Decision-Layer-Architektur absorbiert diese Veränderung. Eine vendor-gebundene Architektur zahlt die Migrationskosten jedes Mal.

Fazit

Die interessante Frage für einen EU-Enterprise-CTO 2026 lautet nicht “Mistral oder OpenAI”. Sie lautet “welcher Anteil meiner agentischen Entscheidungen braucht Flaggschiff-Reasoning, und wie weise ich das meinem Prüfer nach”.

In einem sauber zerlegten Agenten erledigt Mistral Small 3.2 auf einer einzelnen EU-GPU den Großteil der Arbeit zu vernachlässigbaren Token-Kosten. Mistral Medium 3.1 auf La Plateforme deckt die Mittel-Bandbreite mit EU-Souveränität ab. Claude Opus 4.7 oder GPT-5.5 nehmen die wirklich schweren Fälle. Das Routing ist die Architektur. Der Audit-Trail ist das Compliance-Artefakt. Der Decision Layer ist der Ort, an dem all das spezifiziert wird.

Andere publizieren Modellvergleichs-Tabellen. Wir bauen die Routing-Schicht, die sie operationalisiert. Der Modellmarkt verändert sich monatlich; die Routing-Architektur überlebt fünf Modellgenerationen. Quellcode bleibt beim Kunden. Modelle bleiben austauschbar. EU-AI-Act-Artikel-13-Compliance ist eine Eigenschaft der Architektur, kein Projekt am Ende.

Wenn Sie wissen wollen, wie die Komplexitätsverteilung Ihres Agenten tatsächlich aussieht, vereinbaren Sie ein Gespräch.

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.