Was bedeutet modell-agnostisch?

Modell-agnostisch bedeutet: Die Architektur ist nicht an ein bestimmtes Sprachmodell gebunden. Der Model Layer ist austauschbar. Agenten, Decision Layer, Regelwerke und Integrationen funktionieren mit jedem unterstützten Modell.

Warum ist Vendor Lock-in bei LLMs gefährlich?

Weil der LLM-Markt sich schnell verändert. Preise ändern sich, Modelle werden eingestellt, neue Modelle erscheinen, Lizenzmodelle ändern sich. Wer auf ein einzelnes Modell baut, ist von einem Anbieter abhängig.

Kann ein Agent mehrere Modelle gleichzeitig nutzen?

Ja. Multi-Modell-Routing: Ein kostengünstiges Modell für Vorklassifizierung, ein leistungsfähigeres für komplexe Entscheidungen. Das Routing ist regelbasiert und im Decision Layer konfiguriert.

Modell-Agnostik: LLM-Vendor-Lock-in vermeiden

Das Risiko: Ein Modell, ein Anbieter

Viele Unternehmen bauen ihre KI-Strategie auf einem einzelnen Modell auf. “Wir nutzen ChatGPT” oder “Wir setzen auf Claude”. Prompts werden für dieses Modell optimiert. Integrationen werden für die API dieses Anbieters gebaut. Workflows sind auf die Eigenheiten dieses Modells abgestimmt.

Auf einen Blick - Modell-agnostische Architektur

Wer auf einen einzelnen LLM-Anbieter baut, schafft gefährliche Abhängigkeit: Preise ändern sich, APIs werden umgebaut, Modelle kurzfristig eingestellt.
Eine modell-agnostische Architektur entkoppelt Geschäftslogik vom Sprachmodell - Agenten, Decision Layer und Workflows bleiben bei Modellwechseln unverändert.
Multi-Modell-Routing weist einfachen Aufgaben günstige Modelle und komplexem Reasoning Flaggschiffe zu - das spart 40-60 % Token-Kosten.
Self-Hosted-Modelle verarbeiten sensible Daten, Cloud-APIs bedienen unkritische Anfragen - gesteuert durch den Decision Layer.
Forrester (2024) berichtet, dass Unternehmen mit modell-agnostischer Architektur LLM-Migrationskosten um bis zu 70 % senken.

Dann passiert eines von drei Dingen: Der Anbieter erhöht die Preise. Der Anbieter ändert die API. Ein neues Modell erscheint, das deutlich besser oder günstiger ist. In jedem Fall: Die gesamte Implementierung muss angepasst werden.

Im LLM-Markt passiert das schnell. In den letzten 18 Monaten haben sich Preise halbiert, neue Anbieter sind erschienen, Open-Source-Modelle haben proprietäre Modelle in Benchmarks überholt. Wer sich an einen Anbieter gebunden hat, kann diese Entwicklungen nicht nutzen.

Modell-Agnostik als Architekturprinzip

In der Gosign Referenz-Architektur ist der Model Layer eine austauschbare Schicht. Die Geschäftslogik - Regelwerke, Entscheidungslogik, Workflows - ist im Decision Layer und Agent Layer implementiert, nicht im Modell.

Wenn ein neues Modell verfügbar wird, kann es integriert werden, ohne die darüberliegenden Layer zu ändern. Der Agent weiß nicht welches Modell er nutzt. Er stellt eine Anfrage an den Model Layer und bekommt eine Antwort zurück. Welches Modell die Antwort liefert, ist für den Agenten irrelevant.

Multi-Modell-Routing

Ein Agent kann mehrere Modelle gleichzeitig nutzen. Das Routing ist regelbasiert:

Kostenoptimierung: Einfache Aufgaben (Dokumentenklassifizierung, Datenextraktion) laufen über ein kostengünstiges Modell. Komplexe Aufgaben (Entscheidungsunterstützung, Regelinterpretation) über ein leistungsfähigeres Modell.

Data Residency: Sensible Daten gehen an Self-Hosted-Modelle (Llama, Mistral, DeepSeek). Unkritische Daten können über Cloud-APIs laufen.

Failover: Wenn ein Modell-Anbieter ausfällt, kann automatisch auf ein alternatives Modell gewechselt werden.

Die Routing-Regeln sind im Decision Layer konfiguriert und nachvollziehbar.

Unterstützte Modelle

Die Gosign-Architektur unterstützt aktuell:

Claude (Anthropic) - Cloud-API
ChatGPT (OpenAI) - Cloud-API
Gemini (Google) - Cloud-API
Llama (Meta) - Self-Hosted oder Cloud
Mistral - Self-Hosted oder Cloud
DeepSeek - Self-Hosted oder Cloud
gpt-oss (OpenAI) - Self-Hosted oder Cloud

Neue Modelle können integriert werden, sobald sie über eine Standard-API erreichbar sind.

Aspekt	Single-Vendor-Setup	Modell-agnostische Architektur
Modellwechsel	Kompletter Umbau von Prompts, Integrationen, Workflows	Routing-Regel-Änderung, kein Umbau
Kostenkontrolle	An ein Preismodell gebunden	Budget-Modelle für einfache, Flaggschiffe für komplexe Aufgaben
Datensouveränität	Abhängig vom Anbieter	Self-Hosted für sensible, Cloud für unkritische Daten
Failover	Keine Alternative bei Anbieterausfall	Automatischer Wechsel auf alternatives Modell
Migrationskosten	Hoch (Forrester: bis zu 70 % höher)	Niedrig (nur Konfigurationsänderung)
Zukunftssicherheit	Risiko der Abkündigung	Neue Modelle ohne Änderungen integrierbar

Mehr dazu: KI-Infrastruktur

Termin vereinbaren - Wir zeigen Ihnen die modell-agnostische Architektur im Detail.

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.