“¿Dónde se ejecuta?” - La pregunta decisiva

Antes de seleccionar un modelo, antes de construir agents, antes de desplegar un interfaz, hay una pregunta: ¿dónde se ejecutan sus modelos de IA? Esta decisión determina qué garantías de protección de datos puede ofrecer, qué requisitos regulatorios cumple, cuáles son sus costes operativos y qué tan dependiente se vuelve de proveedores externos.

De un vistazo - Estrategia de hosting IA para enterprise

  • Tres niveles: EU SaaS (Cloud APIs), IaaS europeo (Self-Hosted GPU) y on-premises (hardware propio) - más la combinación híbrida.
  • La arquitectura híbrida enruta peticiones por sensibilidad de datos: 60-70% cloud, 25-35% IaaS europeo, 5-10% on-premises.
  • Gartner (2025) estima que el 40% de las grandes empresas operarán arquitecturas híbridas de hosting IA para 2027, frente a menos del 10% en 2024.
  • Modelos open source self-hosted (gpt-oss-120b) se ejecutan en una sola GPU por aprox. 1.200 EUR al mes en proveedores europeos.
  • Los costes totales con estrategia híbrida son un 30-40% inferiores a una estrategia pura de Cloud API, con mayor soberanía de datos.

Existen tres estrategias fundamentales - y una cuarta que se ha convertido en estándar en la práctica: la arquitectura híbrida que combina las tres.

Nivel 1: EU SaaS - Cloud APIs con residencia de datos en la UE

La opción más sencilla y rápida: utiliza las APIs de los proveedores de modelos directamente. Claude a través de la API de Anthropic (región UE), GPT-5.5 a través de Azure OpenAI (centro de datos UE), Gemini a través de Google Cloud Platform (región UE). Los datos salen de su red pero se procesan en centros de datos de la UE.

Ventajas

Arranque más rápido: Sin construir infraestructura, sin aprovisionar servidores GPU, sin necesidad de experiencia en ML-Ops. Configurar una clave API, firmar un contrato de encargado de tratamiento, en producción en horas.

Actualizaciones automáticas: Las actualizaciones de modelos, parches de seguridad y mejoras de rendimiento son desplegadas por el proveedor. Sin esfuerzo de mantenimiento propio.

Escalabilidad: Sin gestión de capacidad. En picos de carga, el proveedor cloud escala automáticamente. Sin sobredimensionamiento, sin infracapacidad.

Variedad de modelos: Acceso a todas las variantes de modelos del proveedor - insignia, equilibrado y presupuestario - a través de la misma API.

Riesgos y limitaciones

Los datos salen de la red corporativa. Incluso con residencia de datos en la UE, sus peticiones se procesan en infraestructura que usted no controla. El proveedor tiene acceso técnico a los datos durante el procesamiento.

CLOUD Act. Los proveedores estadounidenses - incluyendo Anthropic, OpenAI y Google - están sujetos al CLOUD Act. Bajo ciertas condiciones, las autoridades estadounidenses pueden solicitar acceso a datos incluso cuando se almacenan en centros de datos de la UE. Para la mayoría de los datos corporativos, este riesgo es evaluable y aceptable. Para secretos comerciales, datos clasificados o información de infraestructura crítica, no lo es.

Dependencia del proveedor. Con una estrategia de proveedor único, depende de la política de precios, los cambios de API y la disponibilidad de un solo proveedor. Una arquitectura model-agnostic (véase Comparativa de modelos de IA 2026) reduce este riesgo.

Contrato de encargado de tratamiento obligatorio. Para el uso conforme al RGPD se requiere un contrato de encargado de tratamiento con el proveedor. Los tres grandes proveedores ofrecen contratos estándar - revíselos con su departamento jurídico. Atención: Los contratos estándar SaaS de encargado de tratamiento no cubren temas específicos de IA como el registro de prompts, la separación de entornos y las cadenas de proveedores de modelos. Nuestro checklist de requisitos para contratos de IA identifica las diez brechas y proporciona 25 preguntas de verificación.

Adecuado para

  • Tareas estándar con datos no sensibles: resúmenes, traducciones, respuesta general a preguntas
  • Pruebas de concepto y proyectos piloto
  • Tareas con volumen variable donde infraestructura GPU dedicada sería antieconómica
  • Organizaciones sin experiencia en ML-Ops que quieren entrar en producción rápidamente

Nivel 2: IaaS europeo - hosting GPU en proveedores europeos

La opción intermedia: alquila servidores GPU de un proveedor europeo de Infrastructure-as-a-Service - como Hetzner, IONOS o un proveedor especializado de GPU cloud. En estos servidores opera modelos open source como gpt-oss, Llama 4 o Mistral Medium 3.1.

Requisitos de hardware y costes concretos

ModeloRequisito GPUCoste estimado/mes
gpt-oss-120b1x A100/H100 (80 GB)aprox. 1.200 EUR
gpt-oss-20bCPU/16 GB RAM (o GPU pequeña)aprox. 200-400 EUR
Llama 4 Scout1x A100 (80 GB)aprox. 1.200 EUR
Llama 4 Maverick4x A100 (80 GB)aprox. 3.500 EUR
Mistral Medium 3.14x A100 (80 GB)aprox. 3.500 EUR

Ventajas

Los datos permanecen en Europa. El servidor está en un centro de datos europeo, operado por un proveedor europeo. Sin CLOUD Act, sin transferencia transatlántica de datos. Para el cumplimiento del RGPD, es la opción cloud más segura.

Sin vendor lock-in. Opera modelos open source bajo Apache 2.0 o la Meta Llama License. Si quiere cambiar de proveedor de hosting, migra el modelo - sin cuestiones de licencia, sin negociaciones contractuales.

Control total del modelo. Usted decide qué modelo en qué versión se ejecuta. Puede ajustar, cuantizar o reemplazar modelos con versiones más nuevas - sin esperar al proveedor.

Costes predecibles. Los servidores GPU tienen costes fijos mensuales. Sin cargos variables por tokens, sin sorpresas en picos de carga. Para organizaciones con volumen alto y constante, a menudo es más económico que las Cloud APIs.

Requisitos

Competencia ML-Ops. Necesita a alguien que despliegue, monitorice, actualice y resuelva problemas del modelo. Puede ser un ingeniero de ML interno o un proveedor de servicios externo, pero no es esfuerzo cero.

Planificación de capacidad. Un servidor GPU tiene una capacidad definida. Si tiene 500 peticiones simultáneas, una sola GPU no es suficiente. Debe entender perfiles de carga y planificar capacidades.

Sin actualizaciones automáticas. Cuando sale un nuevo modelo, lo despliega usted. Cuando surge un problema de seguridad, lo parchea usted.

Adecuado para

  • Datos corporativos confidenciales (nivel de sensibilidad 2-3)
  • Organizaciones que deben eliminar los riesgos del CLOUD Act
  • Casos de uso con volumen constante y alto (ventaja de coste frente a Cloud APIs)
  • Organizaciones con competencia DevOps/ML-Ops existente

Nivel 3: On-Premises - IA en su propio hardware

La opción de máximo control: opera servidores GPU en su propio centro de datos o en un rack de colocación. Ningún dato sale de su red - bajo ninguna circunstancia.

Ventajas

Máxima soberanía de datos. Sin acceso externo, sin proveedor externo, sin dependencia externa. El hardware es suyo, el modelo es suyo, los datos nunca salen de su red.

Certeza regulatoria. Para operadores de infraestructura crítica, administraciones públicas, sector defensa y organizaciones con datos clasificados, on-premises es a menudo la única opción que cumple los requisitos de compliance.

Sin costes recurrentes de licencia o API. Tras la inversión inicial, solo quedan electricidad, refrigeración y mantenimiento. En operación a largo plazo con alto volumen, on-premises puede ser la opción más económica.

Desafíos

Alta inversión inicial. Un servidor GPU de producción con NVIDIA H100 (80 GB) cuesta entre 25.000 y 40.000 EUR. Para configuraciones más potentes (multi-GPU, redundancia), los costes van de 60.000 a 120.000 EUR o más.

Equipo ML-Ops necesario. On-premises significa: usted es responsable de todo. Mantenimiento de hardware, despliegue de modelos, monitorización, actualizaciones, seguridad. Esto requiere un equipo dedicado o un proveedor de servicios experimentado.

El escalado no es trivial. Cuando la demanda crece, no puede añadir otra GPU con un clic. La adquisición de hardware tarda semanas o meses.

Adecuado para

  • Operadores de infraestructura crítica y administraciones públicas
  • Datos clasificados y niveles de confidencialidad máximos
  • Organizaciones con centro de datos propio y competencia ML-Ops
  • Disposición a inversión a largo plazo con volumen muy alto

eBook gratuito: Infraestructura de IA

Build, Buy, Hybrid - infraestructura conforme al EU AI Act con B/B/H-Framework y 7-Layer Reference Architecture.

Descargar gratis

El árbol de decisión

La siguiente lógica de decisión ayuda en la asignación:

Sus datos contienen PII o secretos comerciales?
+-- NO -> EU SaaS (Nivel 1)
+-- SI -> Infraestructura critica o datos clasificados?
+-- SI -> On-Premises (Nivel 3)
+-- NO -> IaaS europeo (Nivel 2) o Hibrido

En la práctica, la respuesta rara vez es un único nivel. La mayoría de las organizaciones tienen datos de distinta sensibilidad y, por tanto, necesitan una arquitectura que cubra todos los niveles.

Híbrido como estándar: La arquitectura de enrutamiento

La estrategia híbrida combina los tres niveles en una única arquitectura. Una capa de enrutamiento decide automáticamente qué petición pasa por qué canal, basándose en la sensibilidad de los datos, no en la decisión de empleados individuales.

Cómo funciona el enrutamiento

Nivel de sensibilidad 1-2 (público, interno): Las peticiones van por Cloud APIs. Rápido, económico, escalable. Ejemplo: resumir un whitepaper público, traducir un comunicado de prensa, redactar un email general.

Nivel de sensibilidad 3 (confidencial): Las peticiones se enrutan a modelos self-hosted en el centro de datos europeo. Sin fuga de datos, sin CLOUD Act. Ejemplo: analizar contratos internos, procesar datos de RRHH, evaluar datos financieros confidenciales.

Nivel de sensibilidad 4 (estrictamente confidencial / regulado): Las peticiones se ejecutan exclusivamente en infraestructura on-premises. Ejemplo: documentos clasificados, sistemas de infraestructura crítica, datos bajo obligaciones especiales de confidencialidad.

Requisito previo: Clasificación de datos

Para que el enrutamiento funcione, la organización debe clasificar sus datos. Suena laborioso, pero en muchas organizaciones ya existe - por ejemplo, como parte de Sistemas de Gestión de Seguridad de la Información (SGSI) existentes o marcos nacionales de clasificación de seguridad. Las reglas de enrutamiento mapean esta clasificación existente a la infraestructura de IA.

Implementación técnica

La capa de enrutamiento se sitúa entre el Enterprise AI Portal (el interfaz que usan los empleados) y los endpoints de los modelos. Consta de tres componentes:

  1. Clasificador: Detecta automáticamente la sensibilidad de datos de una petición, basándose en palabras clave, sistema de origen o marcado explícito del usuario.
  2. Motor de enrutamiento: Asigna la petición al endpoint de modelo adecuado: Cloud API, IaaS europeo u on-premises.
  3. Audit Log: Registra cada decisión de enrutamiento: qué petición, qué nivel de sensibilidad, qué endpoint. Trazable y exportable.

Efecto en costes

La arquitectura híbrida optimiza no solo la seguridad de los datos sino también los costes. Las Cloud APIs son baratas por petición pero variables. Los modelos self-hosted tienen costes fijos que se amortizan con alto volumen. La combinación aprovecha ambos: Cloud APIs económicas para el grueso de peticiones no sensibles, modelos self-hosted con costes fijos optimizados para el volumen confidencial.

En la práctica, vemos en organizaciones con 1.000+ empleados típicamente la siguiente distribución: 60-70% de las peticiones pasan por Cloud APIs (nivel 1-2), 25-35% por IaaS europeo (nivel 3), y 5-10% por on-premises (nivel 4). Los costes totales son un 30-40% inferiores a una estrategia pura de Cloud API, con mayor soberanía de datos.

Resumen: Los tres niveles de un vistazo

CriterioEU SaaS (Nivel 1)IaaS europeo (Nivel 2)On-Premises (Nivel 3)
Soberanía de datosRegión UE, contrato encargadoEuropa, sin CLOUD ActMáxima
Coste inicialNingunoBajo (alquiler)Alto (60-120K EUR+)
Coste operativoVariable (tokens)Fijo (alquiler GPU)Fijo (electricidad, mantenimiento)
Esfuerzo ML-OpsNingunoMedioAlto
EscalabilidadAutomáticaManualManual, lenta
Adecuado paraDatos nivel 1-2Datos nivel 2-3Datos nivel 3-4

La estrategia correcta es casi siempre una combinación. Gosign implementa la capa de enrutamiento que conecta los tres niveles, para que sus empleados usen un único interfaz y el sistema seleccione automáticamente el camino correcto.

Más información: Infraestructura de IA | Decision Layer & Shadow AI


Enterprise AI Infrastructure Blueprint 2026 - Serie de artículos

Todos los artículos de esta serie: Enterprise AI Infrastructure Blueprint 2026


¿Quiere saber qué estrategia de hosting es la adecuada para sus datos? Gosign analiza su clasificación de datos y diseña la arquitectura híbrida apropiada.

Reserve una consulta - En 30 minutos aclaramos que niveles de hosting necesita.

Bert Gogolin

Bert Gogolin

Director General, Gosign

AI Governance Briefing

IA empresarial, regulación e infraestructura - una vez al mes, directamente de mi parte.

Sin spam. Cancelable en cualquier momento. Política de privacidad