Puedo alojar DeepSeek conforme al RGPD en España?

Sí. Los modelos DeepSeek son open source (licencia MIT) y pueden ejecutarse íntegramente en infraestructura propia, en Azure (región Spain Central o Germany West Central), GCP (europe-southwest1 Madrid) o en servidores propios. Ningún dato sale de la empresa.

Necesito hardware GPU propio para DeepSeek?

No necesariamente. Azure y GCP ofrecen instancias GPU (A100, H100) como servicios gestionados. Self-Hosted es una opción para máximo control, pero no un requisito. La decisión arquitectónica depende de los requisitos de latencia, costes e infraestructura existente.

Qué ocurre cuando aparece un modelo mejor que DeepSeek?

Con una arquitectura agnóstica de modelos: nada. La capa de orquestación enruta entre modelos. Se añade un modelo nuevo, el antiguo queda disponible o se retira. Sin reconstrucción, sin migración, sin vendor lock-in.

DeepSeek es un modelo chino, eso supone un riesgo de seguridad?

No con Self-Hosting. Los modelos open source de DeepSeek se ejecutan localmente, sin conexión a los servidores de DeepSeek. Sin exfiltración de datos, sin llamadas API a China. El código es públicamente auditable. El riesgo solo existe al usar la API de DeepSeek, no al alojar el modelo internamente.

Alojar DeepSeek en tu propia infraestructura

Por qué DeepSeek es relevante para las empresas

DeepSeek ha demostrado con sus modelos open source que los LLMs de alto rendimiento no tienen que proceder necesariamente de OpenAI o Google. DeepSeek R1 alcanza en muchos benchmarks el nivel de GPT-4, con costes operativos significativamente menores y total transparencia sobre el código del modelo.

Para las empresas esto es relevante porque crea una opción real de elección: en lugar de depender de un único proveedor de LLM, las organizaciones pueden ejecutar varios modelos en paralelo, compararlos y utilizar el más adecuado para cada caso de uso.

La pregunta fundamental no es si DeepSeek es lo bastante bueno. La pregunta es cómo una empresa opera LLMs de forma que se garanticen la soberanía de datos, el compliance y la preparación para el futuro, independientemente de qué modelo sea actualmente el más avanzado.

Tres opciones de alojamiento comparadas

Azure: integración enterprise como fortaleza

Azure AI Foundry ofrece DeepSeek como despliegue gestionado. La ventaja para organizaciones con entorno Microsoft existente: integración con Azure Entra ID (antes Azure AD), configuraciones de red y seguridad establecidas, y selección de región para residencia de datos en la UE. Instancias GPU (A100, H100) disponibles en pay-as-you-go o Provisioned Throughput.

El inconveniente: vendor lock-in a nivel de Azure. Migrar después a GCP o Self-Hosted requiere reconstruir la capa de despliegue, salvo que la arquitectura se haya diseñado como agnóstica desde el principio.

GCP: flexibilidad y Kubernetes nativo

Google Cloud Platform ofrece a través de Vertex AI despliegues gestionados de modelos open source. Su fortaleza reside en la arquitectura nativa de Kubernetes: organizaciones que ya usan GKE (Google Kubernetes Engine) pueden ejecutar LLMs como cargas de trabajo en contenedores junto a los servicios existentes. Las opciones TPU ofrecen una alternativa a las GPUs de NVIDIA.

Self-Hosted: máximo control

Para empresas con los requisitos más estrictos de protección de datos, como el sector financiero o sanitario, Self-Hosting es la elección coherente. Los modelos DeepSeek se ejecutan en servidores propios o en un centro de datos privado, sin dependencia alguna de la nube. La contrapartida: mayor esfuerzo operativo en gestión de hardware, actualizaciones y escalado.

Las tres opciones son técnicamente equivalentes. No hay compromisos arquitectónicos con Self-Hosting. La decisión depende del panorama IT existente, los requisitos de compliance y el modelo operativo interno.

Por qué la decisión de alojamiento no es la más importante

La mayoría de los artículos sobre hosting de LLMs terminan en la decisión de alojamiento. Pero para las empresas, el hosting es solo la base; las preguntas reales vienen después.

Cómo se gobierna qué modelo sirve a cada caso de uso? Cómo se registran prompts y respuestas sin comprometer datos de empleados? Cómo se garantiza al Comité de Empresa transparencia sobre el uso de IA, conforme al Estatuto de los Trabajadores? Cómo se ejecuta un cambio de modelo sin modificar la interfaz para 5.000 empleados?

Estas no son preguntas de hosting. Son preguntas de arquitectura y gobernanza. Y precisamente aquí es donde una infraestructura IA enterprise se distingue de un modelo alojado.

Arquitectura agnóstica de modelos como estrategia

El panorama de LLMs cambia más rápido que cualquier ciclo de adquisiciones corporativo. Lo que hoy es estado del arte puede ser superado por un nuevo modelo en seis meses. Quien construye toda su infraestructura sobre DeepSeek, o sobre GPT-4, o sobre Claude, asume un riesgo estratégico.

Una arquitectura agnóstica de modelos desacopla la capa de uso de la capa de modelos. Los empleados utilizan una interfaz de chat unificada. Por detrás, una capa de orquestación enruta entre modelos: DeepSeek para análisis de texto coste-eficiente, Claude para tareas complejas de razonamiento, GPT-4o para aplicaciones multimodales, Llama o Mistral para dominios especializados.

Cambios de modelo, comparativas y tests A/B se ejecutan en la capa de orquestación, de forma transparente para los usuarios, auditable para IT, trazable para el Comité de Empresa.

DeepSeek como componente, no como plataforma

DeepSeek es un modelo potente. Pero ningún modelo por sí solo resuelve el problema enterprise. Lo que las empresas necesitan no es un LLM alojado, sino una infraestructura en la que los LLMs operen como componentes, integrados en Governance by Design, conectados a los sistemas existentes, ampliables con agentes IA que procesan documentos y orquestan flujos de trabajo.

El Decision Layer separa el análisis del LLM de la decisión de negocio. El modelo prepara, el humano decide, con un Audit Trail completo.

En Gosign construimos esta infraestructura IA: agnóstica de modelos, conforme al RGPD, en Azure, GCP o Self-Hosted. DeepSeek es uno de muchos componentes. La arquitectura marca la diferencia.