Infraestructura de IA:
Manual de Gobernanza
para el CTO

Build, Buy, Hybrid - infraestructura conforme
al EU AI Act antes de agosto de 2026

Autora: Theandra Moreira, Directora de Consultoría
Editor: Gosign GmbH, Hamburgo
Fecha: marzo 2026
Extensión: 28 páginas

Índice

1 Por qué el CTO debe liderar el AI Infrastructure Governance
2 Build, Buy, Hybrid: el framework B/B/H
3 EU AI Act: 6 requisitos técnicos
4 Security & Data Sovereignty
5 4 patrones de infraestructura en producción
6 Infrastructure Readiness Assessment
7 Próximos pasos
644 mil M
USD gasto global en infraestructura de IA hasta 2027
Gartner 2024
28%
Gasto en la nube desperdiciado
Flexera 2024
40%
Incidentes de seguridad por mala configuración
ENISA 2024

1 - Por qué el CTO debe liderar el AI Infrastructure Governance

La infraestructura de IA crece más rápido que las estructuras de gobernanza que la controlan.

Según HashiCorp (2024), el 82% de las empresas operan entornos multi-cloud, pero solo el 31% tiene una estrategia de gobernanza centralizada. El resultado: Shadow AI. Los departamentos utilizan APIs de LLM externas sin autorización. Los equipos de ciencia de datos despliegan modelos en endpoints no controlados.

El Stanford HAI AI Index Report (2025) documenta: las inversiones en infraestructura de IA crecen un 29% anual, pero los presupuestos de gobernanza solo crecen un 8%. Esta brecha genera deuda técnica. En España, la AESIA (Agencia Española de Supervisión de la IA) es la autoridad competente para supervisar el cumplimiento del EU AI Act.

Tres niveles de gobernanza

NivelResponsabilidadQuién
Gobernanza de arquitecturaPatrones, modelos y APIs autorizadosCTO + Enterprise Architecture
Gobernanza de operacionesSLAs, monitoring, respuesta a incidentes, gestión de costesInfrastructure + DevOps
Gobernanza de cumplimientoEU AI Act, RGPD, Audit Trail, Data ResidencyCTO + CISO + Legal
Gobernanza de costesPresupuesto, chargeback, detección de desperdicioFinOps + CTO
Gobernanza de seguridadZero Trust, cifrado, gestión de accesosCISO + Platform
Lista de verificación del CTO

Antes de que el primer agente de IA entre en producción:

Según Flexera (2024), las empresas desperdician en promedio el 28% de su gasto en la nube. En cargas de trabajo de IA con instancias GPU, la tasa de desperdicio es aún mayor.

2 - Build, Buy, Hybrid: el framework B/B/H

Cada componente de infraestructura de IA requiere una decisión fundamental: construir internamente, comprar o combinar.

CriterioBuildBuyHybrid
ControlCompletoLimitadoDiferenciado
Data ResidencyGarantizadoDependiente del contratoControlable
Time-to-Value3-6 meses1-4 semanas4-8 semanas
Costes operativosFijos + personalVariable (pay-per-use)Mixto
Vendor Lock-inNingunoAltoMedio

Matriz de decisión por carga de trabajo

Carga de trabajoRecomendaciónJustificación
LLM Inference (estándar)BuyEficiente en costes con volumen variable
LLM Inference (sensible)BuildLos datos no deben salir de la UE
Agent OrchestrationHybridFramework auto-alojado, llamadas LLM enrutadas
Document IntelligenceBuildLos documentos contienen PII
Vector DatabaseHybridGestionada para no sensible, auto-alojada para PII
MonitoringBuyHerramientas especializadas con región UE

Costes ocultos y riesgos ocultos

Build - costes ocultos

Hardware GPU: NVIDIA H100: 25.000-40.000 USD por tarjeta. Clúster de producción: 4-8 tarjetas mínimo.

Personal: Ingenieros MLOps, ingenieros de plataforma, especialistas en seguridad. Al 40% de las empresas les faltan las habilidades (Gartner 2024).

Mantenimiento: Actualizaciones de modelos, parches de seguridad, mejoras de infraestructura. Continuo.

Buy - riesgos ocultos

Data Residency: ¿Dónde se procesan los prompts? ¿Se utilizan para entrenamiento?

Vendor Lock-in: APIs propietarias, formatos de embedding. La migración cuesta 3-6 meses.

Disponibilidad: 12 horas de downtime por trimestre en promedio (Stanford HAI 2025).

La recomendación Hybrid

Para la mayoría de los escenarios empresariales se recomienda un enfoque híbrido: Model Gateway como control central (auto-alojado), enrutamiento por sensibilidad, estrategia de fallback ante caída del proveedor, optimización de costes mediante enrutamiento inteligente de modelos.

3 - EU AI Act: 6 requisitos técnicos

Lo que los juristas leen como obligaciones de cumplimiento, son para el CTO requisitos de infraestructura.

A partir de agosto de 2026 se aplican seis requisitos obligatorios (sujeto al Digital Omnibus Package - posible aplazamiento a diciembre de 2027). En España, la AESIA supervisa la implementación de estos requisitos.

RequisitoArt.Medida de infraestructura
Gestión de riesgos9Confidence Routing, Circuit Breaker, Canary Deployments
Gobernanza de datos10Data Lineage, Immutable Storage, Data Catalog
Obligaciones de registro12Structured Logging, Retención 10+ años, Tamper-Proof
Transparencia13Observability Stack, Decision Explanation API, Model Cards
Supervisión humana14HITL Gateway (arquitectónico), Kill Switch < 1s, Portal Auditor
Precisión/Robustez15Benchmark Pipeline, Adversarial Testing, Redundancia multi-región

Gestión de riesgos (art. 9) - técnico

Confidence Routing: Cada output de agente recibe un valor de confianza. Por debajo del umbral: escalamiento. Circuit Breaker: Desactivación automática ante anomalías. Canary Deployments: Nuevas versiones de modelo de forma gradual, rollback automático ante deterioro.

Obligaciones de registro (art. 12) - técnico

Structured Logging: Cada llamada API, cada decisión de agente, cada intervención HITL. Retención: Vida útil del sistema + 10 años (art. 19). Tamper-Proof: Logs append-only en almacenamiento inmutable.

Supervisión humana (art. 14) - técnico

HITL Gateway: Aprobación humana forzada arquitectónicamente. Sin bypass. Kill Switch: Desactivación inmediata, latencia < 1 segundo. Portal Auditor: Dashboard de solo lectura para auditores de cumplimiento.

Lista de verificación de cumplimiento

Sanciones: Hasta 15 millones de EUR o el 3% de la facturación anual global.

4 - Security & Data Sovereignty

El 40% de los incidentes de seguridad en entornos cloud surgen por mala configuración, no por ataques (ENISA 2024).

4 pilares de Data Sovereignty

PilarRequisitoImplementación
Data ResidencyTodo el procesamiento en centros de datos de la UEModelos auto-alojados o región UE en el proveedor
CifradoAt Rest, In Transit, In UseAES-256, TLS 1.3, mTLS, Confidential Computing
Zero TrustSin confianza implícitaIdentity-Based Access, Least Privilege, Micro-Segmentation
Supply ChainOrigen de modelos y software verificadoModel Provenance, SBOM, Container Scanning, Signed Artifacts

Data Residency en detalle

ComponenteRequisito UEImplementación
LLM InferenceLos prompts no deben salir de la UEAuto-alojado o región UE en el proveedor
Vector DatabaseLos embeddings contienen conocimiento codificadoRegión UE o auto-alojado
LoggingLos logs contienen PIIAlmacenamiento UE con política WORM
BackupsMismas reglas que datos de producciónRegión UE, cifrado

Cumplimiento del RGPD en el uso de LLM

EscenarioRiesgoMedida
PII en promptsArt. 6 - Base jurídicaPII-Stripping antes de llamada API
Datos de clientes en RAGArt. 5 - Limitación de finalidadControl de acceso a nivel de documento
Logs con datos de usuariosArt. 17 - Derecho de supresiónPseudonimización + política de retención
Embeddings con PIIArt. 22 - Decisiones automatizadasDocumentación de transparencia

5 - 4 patrones de infraestructura en producción

Patrón 1: Agent Orchestration

Los frameworks de agentes están diseñados para experimentación, no para producción. Los agentes empresariales necesitan: permisos definidos, audit trails, rollback, control de costes.

ComponenteFunciónTecnología
OrchestratorWorkflow, enrutamiento de tareas, paralelizaciónTemporal, Prefect, Custom
Permission LayerPermisos de agente para herramientas/APIsOPA, Cedar
State ManagementContexto, memoria, progreso de tareasRedis, PostgreSQL
ObservabilityTraces, consumo de tokens, latenciaOpenTelemetry, Langfuse

Resultado: MTTR en fallos de agentes -70%. Costes de API descontrolados -40-60% (proyectos Gosign).

Patrón 2: Document Intelligence

El 80% de los datos empresariales no están estructurados (IDC 2024). Un pipeline de Document Intelligence clasifica, extrae y vectoriza documentos automáticamente.

EtapaFunciónTecnología
IngestionLectura de PDF, Word, escáner, emailTika, Unstructured.io
OCRConversión de escáneres a textoTesseract, PaddleOCR
ClasificaciónReconocimiento del tipo de documentoFine-tuned Classifier
ExtracciónExtracción de datos estructuradosLLM + Schema Validation
EmbeddingVectorización de documentosSentence Transformers
StorageVectores + metadatospgvector, Qdrant

Resultado: 92-97% de precisión en clasificación. Procesamiento manual -60-80%.

Patrón 3: Model Gateway

Capa central entre aplicaciones y proveedores de LLM. Enrutamiento, detección de PII, rate limiting, caché, fallback, logging.

Tipo de solicitudEnrutamientoJustificación
Contiene PIIModelo auto-alojadoLos datos permanecen en la UE
Clasificación estándarModelo más económicoOptimización de costes
Análisis complejoModelo más potenteCalidad priorizada
Proveedor A caídoProveedor BDisponibilidad

Resultado: Costes de LLM -30-50% mediante enrutamiento y caché. Cumplimiento mediante screening centralizado de PII.

Patrón 4: Monitoring & Observability

Los sistemas de IA fallan silenciosamente. Un LLM con respuestas deficientes no lanza ningún error.

NivelQué se mideHerramientas
InfrastructureCPU, GPU, memoria, redPrometheus, Grafana
ApplicationLatencia, tasa de error, throughputOpenTelemetry, Jaeger
ModelConfianza, tokens, alucinaciónLangfuse, WhyLabs
BusinessZero-touch rate, escalamientoCustom Dashboards
CostCostes de API por equipo/proyectoInfracost, Custom
ComplianceCompletitud de auditoría, cuota HITLCustom + SIEM

Resultado: Problemas de calidad detectados 4 veces más rápido. Duración del impacto de incidentes -65% (Gartner 2024).

6 - Infrastructure Readiness Assessment

10 preguntas para el CTO. Evalúe cada una con 0 (no), 1 (parcialmente) o 2 (sí).

#Pregunta012
1Inventario completo de todos los sistemas y APIs de IA (incl. Shadow AI).
2Arquitectura de referencia aprobada para cargas de trabajo de IA con patrones definidos.
3Todo el procesamiento de datos de IA verificadamente en centros de datos de la UE.
4Model Gateway con screening de PII y logging centralizado.
5Structured Logging para cada llamada API y cada decisión de agente.
6Kill Switch para agentes individuales y sistema de IA completo (< 1s).
7Costes de GPU/API rastreados por equipo, proyecto y caso de uso.
8Evaluación automática de benchmark y adversarial antes del despliegue.
9Estrategia de backup y DR específica para infraestructura de IA.
10Los 6 requisitos del EU AI Act (art. 9-15) verificadamente cumplidos.
PuntuaciónEvaluaciónRecomendación
16-20Production-ReadyOptimización y escalado. Preparado para cargas reguladas.
10-15Base existenteCerrar brechas: logging, screening de PII, Kill Switch.
5-9Necesidad de mejoraArquitectura de referencia, Model Gateway, inventariar Shadow AI.
0-4Necesidad de acciónComenzar inmediatamente. Inventario + arquitectura de referencia.
Distribución de inversión (recomendación vs. realidad)
PartidaActualRecomendación
Modelos & Compute70%35-40%
Plataforma de infraestructura15%25-30%
Gobernanza & Cumplimiento5%15-20%
Observability & Monitoring5%10-15%
Seguridad5%10-15%

7 - Próximos pasos

El plan de 90 días

MesEnfoqueResultado
1Inventario & ArquitecturaInventario de IA, arquitectura de referencia, Data Residency verificado, Cost Baseline
2Gateway & GobernanzaModel Gateway en producción, Structured Logging, Kill Switch, Observability Stack
3Cumplimiento & PilotoLista de verificación EU AI Act, Benchmark Pipeline, Adversarial Testing, auditoría de cumplimiento

Stack de infraestructura recomendado

CapaRecomendaciónAlternativas
Model GatewayLiteLLM, PortkeyCustom (Go/Python)
Agent OrchestrationTemporal + CustomPrefect, Airflow
Vector Databasepgvector (PostgreSQL)Qdrant, Weaviate
ObservabilityOpenTelemetry + GrafanaDatadog, Langfuse
Policy EngineOPACedar, Casbin
Secret ManagementVaultAWS KMS, SOPS
Container RuntimeKubernetesNomad, ECS
CI/CDGitHub ActionsGitLab CI, Tekton
Consultoría

Analizamos su infraestructura de IA e identificamos las brechas críticas.

Cumplimiento normativo, seguridad y gobernanza de costes - 30 minutos, gratuito, sin compromiso.

Theandra Moreira - Directora de Consultoría, Gosign GmbH

Contacto: www.gosign.de/es/contacto

Web: www.gosign.de