Kann ich DeepSeek DSGVO-konform in Deutschland hosten?

Ja. DeepSeek-Modelle sind Open Source (MIT-Lizenz) und können vollständig in eigener Infrastruktur betrieben werden - in Azure (Region Germany West Central), GCP (Region europe-west3) oder auf eigenen Servern. Keine Daten verlassen das Unternehmen.

Brauche ich eigene GPU-Hardware für DeepSeek?

Nicht zwingend. Azure und GCP bieten GPU-Instanzen (A100, H100) als Managed Service. Self-Hosted ist eine Option für maximale Kontrolle, aber kein Muss. Die Architekturentscheidung hängt von Latenzanforderungen, Kosten und bestehender Infrastruktur ab.

Was passiert, wenn ein besseres Modell als DeepSeek erscheint?

Bei einer modell-agnostischen Architektur: nichts. Die Orchestrierungsschicht routet zwischen Modellen. Ein neues Modell wird hinzugefügt, das alte bleibt verfügbar oder wird abgeschaltet. Kein Umbau, keine Migration, kein Vendor-Lock-in.

DeepSeek ist ein chinesisches Modell - ist das ein Sicherheitsrisiko?

Nicht bei Self-Hosting. Die Open-Source-Modelle von DeepSeek laufen lokal, ohne Verbindung zu DeepSeek-Servern. Kein Datenabfluss, keine API-Calls nach China. Der Code ist öffentlich einsehbar und auditierbar. Das Risiko besteht nur bei Nutzung der DeepSeek-API - nicht beim eigenen Hosting.

DeepSeek in der eigenen Infrastruktur hosten

Warum DeepSeek für Unternehmen relevant ist

DeepSeek hat mit seinen Open-Source-Modellen gezeigt, dass leistungsfähige LLMs nicht zwingend von OpenAI oder Google kommen müssen. DeepSeek R1 erreicht in vielen Benchmarks GPT-4-Niveau - bei deutlich niedrigeren Betriebskosten und mit vollständiger Transparenz über den Modell-Code.

Auf einen Blick - DeepSeek im Enterprise-Einsatz

DeepSeek R1 ist Open Source (MIT-Lizenz) und kann vollständig Self-Hosted in Azure, GCP oder On-Premise betrieben werden - ohne Datenabfluss.
Self-Hosting eliminiert das DSGVO-Risiko der API-Nutzung, bei der Daten nach China fließen. Das Modell selbst ist nicht das Risiko - die API ist es.
Drei Hosting-Optionen (Azure, GCP, Self-Hosted) sind technisch gleichwertig; die Wahl hängt von IT-Landschaft und Compliance ab.
Eine modell-agnostische Architektur verhindert DeepSeek-Vendor-Lock-in: Wenn ein besseres Modell erscheint, wird es ohne Umbau integriert.
IDC (2024) schätzt, dass 42 % der europäischen Großunternehmen bis Ende 2026 mindestens ein Open-Weight-LLM auf eigener Infrastruktur betreiben werden.

Für Unternehmen ist das relevant, weil es eine echte Wahlmöglichkeit schafft: Statt sich an einen einzigen LLM-Anbieter zu binden, können Organisationen verschiedene Modelle parallel betreiben, vergleichen und je nach Anwendungsfall das passende Modell einsetzen.

Die eigentliche Frage ist nicht, ob DeepSeek gut genug ist. Die Frage ist, wie ein Unternehmen LLMs so betreibt, dass Datenhoheit, Compliance und Zukunftssicherheit gewährleistet sind - unabhängig davon, welches Modell gerade führend ist.

Drei Hosting-Optionen im Vergleich

Azure: Enterprise-Integration als Stärke

Azure AI Foundry bietet DeepSeek als Managed Deployment an. Der Vorteil für Unternehmen mit bestehender Microsoft-Landschaft: Integration in Azure Entra ID (ehemals Azure AD), bestehende Netzwerk- und Sicherheitskonfigurationen, und Region-Auswahl für EU-Datenresidenz. GPU-Instanzen (A100, H100) sind als Pay-as-you-go oder Provisioned Throughput verfügbar.

Der Nachteil: Vendor-Lock-in auf Azure-Ebene. Wer später zu GCP oder Self-Hosted wechseln will, muss die Deployment-Schicht neu aufbauen - wenn die Architektur nicht von Anfang an modell- und plattformagnostisch angelegt ist.

GCP: Flexibilität und Kubernetes-native

Google Cloud Platform bietet über Vertex AI ebenfalls Managed Deployments für Open-Source-Modelle. Die Stärke liegt in der Kubernetes-nativen Architektur: Wer bereits GKE (Google Kubernetes Engine) nutzt, kann LLMs als Container-Workloads neben bestehenden Services betreiben. TPU-Optionen bieten eine Alternative zu NVIDIA-GPUs.

Self-Hosted: Maximale Kontrolle

Für Unternehmen mit strengsten Datenschutzanforderungen - etwa im Finanzsektor oder im Gesundheitswesen - ist Self-Hosting die konsequente Wahl. DeepSeek-Modelle laufen auf eigenen Servern oder in einem privaten Rechenzentrum, ohne jede Cloud-Abhängigkeit. Der Trade-off: höherer operativer Aufwand für Hardware-Management, Updates und Skalierung.

Kriterium	Azure	GCP	Self-Hosted
Setup	Managed (AI Foundry)	Managed (Vertex AI)	Manuell (Bare-Metal/VM)
EU-Datenresidenz	Germany West Central	europe-west3	Eigenes Rechenzentrum
GPU-Verfügbarkeit	A100, H100 (Pay-as-you-go)	A100, H100, TPU	A100, H100 (Kauf/Leasing)
Vendor-Lock-in-Risiko	Hoch (Azure-spezifisch)	Mittel (Kubernetes-portabel)	Keines
Operativer Aufwand	Niedrig	Niedrig-Mittel	Hoch
Am besten für	Microsoft-zentrierte Orgs	Kubernetes-native Orgs	Maximale Datensouveränität

Alle drei Optionen sind technisch gleichwertig. Es gibt keine architektonischen Kompromisse beim Self-Hosting. Die Entscheidung hängt von der bestehenden IT-Landschaft, den Compliance-Anforderungen und dem internen Betriebsmodell ab.

Warum die Hosting-Entscheidung nicht die wichtigste ist

Die meisten Artikel über LLM-Hosting enden bei der Hosting-Entscheidung. Aber für Unternehmen ist das Hosting nur die Grundlage - die eigentlichen Fragen kommen danach.

Wie wird gesteuert, welches Modell für welchen Anwendungsfall eingesetzt wird? Wie werden Prompts und Antworten geloggt, ohne Mitarbeiterdaten zu kompromittieren? Wie wird sichergestellt, dass der Betriebsrat Transparenz über den KI-Einsatz hat? Wie wird ein Modellwechsel durchgeführt, ohne dass sich für 5.000 Mitarbeiter das Interface ändert?

Das sind keine Hosting-Fragen. Das sind Architektur- und Governance-Fragen. Und genau hier unterscheidet sich eine Enterprise-KI-Infrastruktur von einem gehosteten Modell.

Modell-agnostische Architektur als Strategie

Die LLM-Landschaft verändert sich schneller als jeder Enterprise-Beschaffungszyklus. Was heute state-of-the-art ist, kann in sechs Monaten von einem neuen Modell überholt werden. Wer seine gesamte Infrastruktur auf DeepSeek baut - oder auf GPT-4, oder auf Claude - hat ein strategisches Risiko.

Eine modell-agnostische Architektur entkoppelt die Nutzungsschicht von der Modellschicht. Mitarbeiter nutzen ein einheitliches Chat-Interface. Dahinter routet eine Orchestrierungsschicht zwischen verschiedenen Modellen: DeepSeek für kosteneffiziente Textanalyse, Claude für komplexe Reasoning-Aufgaben, GPT-4o für multimodale Anwendungen, Llama, Mistral oder gpt-oss für spezialisierte Domänen.

Modellwechsel, Modellvergleiche und A/B-Tests erfolgen in der Orchestrierungsschicht - transparent für Nutzer, auditierbar für die IT, nachvollziehbar für den Betriebsrat.

DeepSeek als Baustein, nicht als Plattform

DeepSeek ist ein leistungsfähiges Modell. Aber kein Modell allein löst das Enterprise-Problem. Was Unternehmen brauchen, ist nicht ein gehostetes LLM, sondern eine Infrastruktur, in der LLMs als Komponenten arbeiten - eingebettet in Governance by Design, integriert in bestehende Systeme, erweiterbar um AI-Agenten, die Dokumente verarbeiten und Workflows orchestrieren.

Der Decision Layer trennt dabei die LLM-Analyse von der Geschäftsentscheidung. Das Modell bereitet vor, der Mensch entscheidet - mit vollständigem Audit-Trail.

Bei Gosign bauen wir diese KI-Infrastruktur: modell-agnostisch, DSGVO-konform, in Azure, GCP oder Self-Hosted. DeepSeek ist einer von vielen Bausteinen. Die Architektur macht den Unterschied.

Bert Gogolin

Geschäftsführer, Gosign

AI Governance Briefing

Enterprise AI, Regulierung und Infrastruktur - einmal im Monat, direkt von mir.