Cuándo tiene sentido Mistral frente a Claude o GPT-5?

Mistral es el caballo de batalla para aproximadamente el 70% de las decisiones agénticas si el agente está bien descompuesto: aplicación de reglas, extracción estructurada, clasificación. Claude Opus 4.7 o GPT-5.5 quedan para el 8 a 10% con carga real de razonamiento. La pregunta no es qué modelo es el mejor, sino qué modelo para cada micro-decisión.

Qué es gpt-oss y en qué se diferencia de Mistral?

gpt-oss-120b es el primer modelo de pesos abiertos de OpenAI desde GPT-2, publicado el 5 de agosto de 2025 bajo Apache 2.0. Alcanza razonamiento a nivel o4-mini en una sola GPU de 80 GB. Frente a Mistral Small 3.2 (24B parámetros, una sola GPU de consumo), gpt-oss-120b cubre las cargas de razonamiento más pesadas. Ambos son opciones legítimas para autohospedaje y soberanía de datos en la UE.

Cómo satisface Decision Routing el artículo 13 del EU AI Act?

El artículo 13 exige que los sistemas de IA de alto riesgo operen con transparencia para que los responsables del despliegue puedan interpretar las salidas. Una capa de Decision Routing fuerza esto técnicamente: cada decisión se registra con la entrada, la versión de la regla, el modelo utilizado, el nivel de confianza (si fue IA), la cadena de razonamiento (si aplica) y el aprobador humano (si hubo escalación). El Audit Trail es el artefacto de cumplimiento del artículo 13.

Cuándo Mistral, cuándo Claude Opus? Decision Routing para Enterprise UE 2026

Q: Es Mistral realmente soberano en la UE?

Mistral La Plateforme se aloja por defecto en la UE sobre infraestructura francesa. Desde el segundo trimestre de 2026, la compañía opera su propio centro de datos en Bruyères-le-Châtel, al sur de París, con 13.800 GPU NVIDIA GB300 y 44 megavatios de capacidad. Mistral Small 3.2 está bajo licencia Apache 2.0 y se autohospeda completamente en una sola RTX 4090. Ambas opciones quedan fuera del alcance del US CLOUD Act, a diferencia de Azure OpenAI UE.

El mercado de modelos maduró más rápido que la mayoría de arquitecturas enterprise. Claude Opus 4.7, GPT-5.5 y Gemini 3.1 Pro convergen en calidad. Mistral La Plateforme opera desde un centro de datos francés bajo jurisdicción UE. OpenAI publicó gpt-oss bajo Apache 2.0 en agosto de 2025. Meta y Mistral entregan modelos de pesos abiertos que funcionan en una sola GPU y alcanzan calidad de producción.

Y aún así, la mayoría de proyectos de IA enterprise siguen eligiendo un único modelo y enrutando cada workload a través de él. Esa decisión determina silenciosamente otras tres cosas: la posición de soberanía cloud, el coste de auditoría bajo el EU AI Act y el margen para optimización de costes. Elegir un modelo no es una decisión de modelo. Es una decisión de arquitectura.

De un vistazo - Stack Agéntico para Enterprise UE 2026

Alrededor del 70% de las decisiones agénticas en un workflow bien descompuesto son aplicación de reglas o extracción estructurada. En despliegues de hosting UE típicos, Mistral Small 3.2 en una sola GPU las cubre a aproximadamente 1/30 del precio de lista de Claude Opus.
Mistral tiene dos superficies de despliegue distintas: La Plateforme (API alojada en la UE, infraestructura francesa, centro de datos dedicado en Bruyères-le-Châtel en el segundo trimestre de 2026) y Mistral Small 3.2 (Apache 2.0, totalmente autohospedable, 24B parámetros).
El 8 al 10% restante de decisiones (razonamiento complejo, análisis transjurisdiccional, escalación de casos límite) justifica Claude Opus 4.7 o GPT-5.5. Ahí es donde el gasto en tokens se gana, no se malgasta.
La exposición al US CLOUD Act aplica incluso a despliegues UE de proveedores estadounidenses. Schrems II lo hizo concreto. Solo Mistral Small autohospedado, gpt-oss-120b o DeepSeek V4-Flash (preview abril 2026, MIT, 284B/13B activo MoE) tienen superficie CLOUD Act cero.
El artículo 13 del EU AI Act exige operación transparente de los sistemas de alto riesgo. Una capa de Decision Routing produce el artefacto de auditoría: un registro por decisión con entrada, versión de regla, modelo, nivel de confianza y aprobador humano cuando hay escalación.

Evalúas Mistral - lo que realmente evalúas es tu estrategia cloud UE

El recorrido típico en 2026 se ve así. Compliance pide una alternativa UE a OpenAI. Compras recopila ofertas de proveedores. Arquitectura empieza a evaluar Mistral. En una semana la conversación se desplazó de “qué modelo” a “cuál es nuestra posición frente al US CLOUD Act” y “cómo operacionalizamos el artículo 13 del EU AI Act para sistemas de alto riesgo”.

El CLOUD Act sigue el control del proveedor, no la ubicación de los datos. Un proveedor estadounidense con centros de datos UE - Azure OpenAI UE, AWS Bedrock Frankfurt, GCP Vertex europe-west - puede ser obligado a entregar datos bajo orden judicial estadounidense. La Comisión Europea prevé publicar un Tech Sovereignty Package en el segundo trimestre de 2026, restringiendo el uso público de proveedores estadounidenses para cargas sensibles en sanidad, finanzas y sistemas judiciales. La contratación privada lee esas señales.

Para DPO: CLOUD Act + Schrems II no elimina SCC (Cláusulas Contractuales Tipo Comisión 2021/914) + TIA (Transfer Impact Assessment según Recomendaciones EDPB 01/2020) como vía legal. Pero la TIA debe documentar medidas técnicas suplementarias (cifrado client-side, fragmentación, etc.) y mostrar equivalencia de protección - lo que para proveedor US bajo CLOUD Act es prácticamente imposible. Self-hosting elimina la cuestión por completo.

Mistral interesa no porque gane a Claude en una tabla de ranking. Interesa porque ocupa una posición que ningún proveedor estadounidense puede ocupar: un proveedor europeo frontier-class con infraestructura UE dedicada y una línea de modelos de pesos completamente abiertos bajo Apache 2.0. Desde el segundo trimestre de 2026 la compañía opera su propio centro de datos cerca de París con 13.800 GPU NVIDIA GB300 y 44 megavatios de capacidad. Eso convierte a Mistral en el único proveedor frontier que puede ofrecer residencia UE end-to-end sobre infraestructura propiedad de y operada bajo jurisdicción UE.

Pero esto enmarca mal la pregunta. La pregunta real no es “Mistral o OpenAI”. Es “qué decisiones van dónde, y cómo se demuestra a un auditor”.

Mistral son dos mundos: La Plateforme en Francia o Mistral Small Apache 2.0

La confusión empieza cuando se trata a “Mistral” como un único producto. Son dos familias de productos con distintas superficies de despliegue e implicaciones de cumplimiento.

Producto Mistral	Despliegue	Licencia / coste	Soberanía UE
Mistral Medium 3.1	La Plateforme (API en FR) o Azure AI Foundry	Por tokens, propietario	Sí vía La Plateforme
Mistral Small 3.2	Autohospedaje on-prem	Apache 2.0, solo coste GPU	Sí si hardware UE
Mixtral 8x22B	Autohospedaje on-prem	Apache 2.0, solo coste GPU	Sí si hardware UE
Codestral	La Plateforme	Por tokens, propietario	Sí vía La Plateforme

“Soberanía UE” significa: fuera del alcance del US CLOUD Act. Tanto La Plateforme (jurisdicción francesa) como el autohospedaje en hardware UE cumplen. Azure AI Foundry no, incluso con residencia de datos UE, porque Microsoft sigue sujeto a órdenes del CLOUD Act.

Mistral Medium 3.1 es la flagship propietaria frontier-class. Funciona sobre la infraestructura francesa propia de Mistral, accesible por API. Facturada por tokens. Soberana UE por defecto. Desde el segundo trimestre de 2026 el centro de datos dedicado en Bruyères-le-Châtel atiende la inferencia para clientes que exigen residencia francesa garantizada.

Mistral Small 3.2 es el caballo de batalla de pesos abiertos. 24 mil millones de parámetros. Contexto de 128K tokens. Comprensión visual incluida. Publicado en marzo de 2025 bajo Apache 2.0. Funciona en una sola NVIDIA RTX 4090 o en un Mac con 32 GB de RAM. Throughput de aproximadamente 150 tokens por segundo en hardware de consumo.

Los dos no son redundantes. La Plateforme tiene sentido cuando se quiere soberanía UE sin operar infraestructura GPU. Mistral Small 3.2 tiene sentido cuando la decisión es de tan alto volumen que la facturación por tokens se convierte en el driver de coste, o cuando los datos son tan sensibles que incluso el tráfico de API UE es demasiada superficie.

La pregunta de arquitectura es qué superficie de despliegue para cada decisión, no qué proveedor para cada ranking.

Perfil de modelo en seis dimensiones empresariales - vista comparativa estilo c't, puntuada 0 a 10. Los flagships cloud (Claude Opus 4.7, GPT-5.5) dominan en Razonamiento, Codificación, Multimodal, pero pierden en Eficiencia de costes y Soberanía UE. Los modelos self-host (Mistral Small 3.2, DeepSeek V4-Pro) invierten esa forma. No hay un modelo "mejor" - la capa de routing elige la forma correcta por micro-decisión.

Por qué Mistral Small por defecto, no gpt-oss ni DeepSeek

Pregunta razonable una vez que se opta por autohospedaje: por qué Mistral Small 3.2 gana el puesto de workhorse frente a gpt-oss-120b (Apache 2.0, 117B params MoE, 5 de agosto de 2025) o DeepSeek V4 (MIT, preview del 24 de abril de 2026; V4-Flash 284B/13B activo, V4-Pro 1.6T/49B activo, contexto 1M)? Los tres son legítimamente autohospedables en alguna configuración. La diferenciación está en suelo de hardware, cobertura lingüística y modalidad.

Modelo open source	Suelo de hardware (CAPEX)	OPEX hosted (UE)	Fortaleza	Debilidad	Sweet spot
Mistral Small 3.2 (24B, Apache 2.0)	1× RTX 4090 ~1.500 EUR o 1× H100 ~30.000 EUR	~1.500-2.500 EUR/mes (1× H100 hosted)	Volumen, multilingüe (DE/EN/PL/ES/BR), capacidad visual, ~150 tok/s	No es razonamiento de máximo nivel	Workhorse por defecto para la banda de volumen del 70%
gpt-oss-120b (117B MoE, Apache 2.0)	1× H100/A100 80GB ~30.000 EUR	~1.200-2.500 EUR/mes (1× H100 hosted)	Razonamiento a nivel o4-mini, eficiente con MoE	Sin visión, requiere hardware de datacenter	Alternativa de razonamiento pesado a Claude Opus, cuando incluso eso debe quedar on-prem
DeepSeek V4-Flash (MIT, preview abr 2026)	1-4× H100/A100 80GB ~30.000-120.000 EUR con quant	~1.500-5.000 EUR/mes (1-4× H100 hosted)	Razonamiento frontier-class con hardware moderado, contexto 1M, multimodal nativo	Estado preview - los benchmarks deben reverificarse antes de producción	Especialista mate/lógica + análisis de carteras con contexto 1M
DeepSeek V4-Pro (MIT, preview abr 2026)	Clúster 8× H100 ~240.000 EUR CAPEX	~10.000-12.000 EUR/mes (8× H100 hosted)	Se aproxima a rendimiento de GPT-5.5/Gemini 3.1 Pro, optimizado para agent-tooling	Hardware clase datacenter; partida estándar de presupuesto TI para gran empresa, API/hosted para PYME	Razonamiento frontier bajo licencia abierta: on-prem para gran empresa, API/hosted para PYME
DeepSeek R1 (MIT, ene 2025)	4-8× H100 ~120.000-240.000 EUR	~5.000-10.000 EUR/mes (4-8× H100 hosted)	Especialista mate/lógica maduro	Mayormente superado por V4-Flash en despliegues nuevos	Despliegues maduros con foco mate/lógica
Llama 4 Scout (Meta Llama License)	1× GPU ~30.000 EUR	~1.500 EUR/mes (1× H100 hosted)	Contexto de 10M tokens	Restricción de licencia con >700M MAU	Contexto ultralargo para carteras completas de contratos

DeepSeek V4-Pro es open source bajo licencia MIT (pesos publicados en Hugging Face) - la cuestión nunca fue de licencia, sino de tamaño de empresa. Para una gran empresa del IBEX-35 o mediana empresa superior, 240.000 EUR de CAPEX son una partida estándar del presupuesto TI; el modelo corre on-prem como cualquier otro workload datacenter. Para una PYME por debajo de 500 empleados, el camino realista es V4-Pro vía API (Together.ai, Fireworks, DeepSeek API) o como variante hospedada en proveedores UE - misma licencia abierta, sin CAPEX hardware.

Tres razones concretas por las que Mistral Small gana el puesto por defecto:

Umbral de hardware. Mistral Small funciona en silicio de consumo. gpt-oss-120b necesita una GPU de datacenter. Para una pipeline enterprise con cinco a diez nodos worker, el delta de hardware por nodo es significativo. Cuando el 70% de las decisiones son clasificación o extracción, la capacidad de razonamiento gpt-oss-grade es sobredimensionada para el trabajo de volumen.

Corpus de entrenamiento multilingüe. Mistral fue entrenado desde el inicio sobre datos en francés, alemán, español e italiano. gpt-oss es US-céntrico con entrenamiento dominado por inglés. Para una pipeline Enterprise UE que procesa documentos en español, polaco o portugués, Mistral Small es el mejor workhorse desde el día uno.

Visión incluida. Mistral Small 3.2 tiene capacidad de visión nativa. gpt-oss no. Para onboarding de RRHH (escaneo de DNI, certificados, formularios IRPF) o cuentas a pagar (facturas PDF con layout), esto es un knockout duro.

gpt-oss-120b o DeepSeek V4-Flash entran en el stack como opciones de razonamiento pesado on-prem cuando la API de Claude Opus 4.7 no puede usarse por motivos de cumplimiento. DeepSeek V4-Pro se aproxima al rendimiento frontier-closed-source bajo licencia MIT, pero su suelo de hardware (clúster 8× H100) lo sitúa en territorio API u hospedado para la mayoría de empresas. Ninguno reemplaza a Mistral Small como workhorse de volumen - lo complementan para las decisiones más difíciles. La comparativa detallada de autohospedaje se cubre en IA Open Source Autohospedada 2026: Mistral, gpt-oss, DeepSeek V4, Llama 4 en el stack enterprise (artículo separado).

Qué modelo para qué? La distribución de complejidad de decisiones agénticas

Un agente enterprise típico se descompone en 14 a 50 micro-decisiones. La complejidad no se distribuye uniformemente. En una pipeline de RRHH o Finanzas bien instrumentada, sigue un patrón que medimos consistentemente:

Tipo de decisión	Porcentaje	Complejidad	Mejor modelo	Coste real por 1M tokens
Aplicación de reglas (clase fiscal IRPF desde maestro, clasificación de tipo de contrato, comprobación de umbrales)	50%	Baja	Frecuentemente sin LLM; en otro caso Mistral Small 3.2, Llama 4 Scout, gpt-oss-20b	~0 a ~0,50 USD
Extracción estructurada (extracción de campos de PDF, normalización de tablas, líneas OCR-corregidas)	25%	Media	Mistral Small 3.2, Mistral Medium 3.1, gpt-oss-120b	~0,50 a ~2 USD
Clasificación contextual (revisión de cláusula bajo ET art. 64, detección de anomalías en gastos, banderas de riesgo de proveedor)	15%	Media-alta	Mistral Medium 3.1, Claude Haiku 4.5, GPT-5 mini	~1 a ~5 USD
Razonamiento complejo (análisis transjurisdiccional Ley 15/2022, síntesis de argumento multi-paso, redacción de escalaciones)	8%	Alta	Claude Opus 4.7, GPT-5.5	~15 a ~25 USD
Multimodal (correlación imagen-texto, segmentos de vídeo, revisión de planos técnicos)	2%	Alta	Gemini 3.1 Pro	~5 a ~10 USD

La consecuencia es directa. Si se enruta cada decisión por Claude Opus, se paga tarifa flagship por tokens para el 75% del trabajo que no necesita razonamiento flagship. Si se enruta todo por Mistral Small, se ahorra coste de tokens pero se falla en el 8% donde el razonamiento clase Opus realmente importa - y se paga el coste en findings de auditoría, no en tokens.

El AI Index 2025 de Stanford HAI registra que el 65,7% de los modelos foundation publicados en 2023 fueron open source, frente al 33,3% en 2021. La adopción enterprise de IA superó el 78%. El mercado ya no elige entre propietario y abierto. Elige cómo componerlos.

Mistral Small como workhorse: un agente de onboarding de RRHH con 14 micro-decisiones

Ejemplo concreto. Un agente de onboarding de RRHH recibe el contrato firmado de una nueva incorporación más documentación de soporte (copia del DNI o NIE, modelo 145 IRPF, datos bancarios, certificados de cualificación). Su trabajo: producir el registro maestro de personal, ejecutar comprobaciones de cumplimiento previas al empleo, programar onboarding, registrar el alta en el Sistema RED de la TGSS. Catorce micro-decisiones en total, desde validación regex hasta análisis de no discriminación bajo la Ley 15/2022.

Una implementación ingenua envía cada paso a Claude Opus 4.7. Una implementación descompuesta enruta por paso. El Decision Layer contiene las reglas de enrutado: cada paso se clasifica como REGLAS, IA AUTÓNOMA o HUMANO antes de ejecutarse.

REGLAS: La decisión es determinista. El formato del NIF/NIE sigue una regla de checksum, el IBAN sigue ISO 13616. No hay interpretación, no hay modelo necesario. Aquí el agente es ejecutor, no razonador.

IA AUTÓNOMA: La decisión es clasificación o extracción con confianza suficiente. Detección del tipo de documento, clasificación del tipo de contrato (art. 14 ET, alta), extracción estructurada de campos. Un modelo pequeño con un esquema claro vence a un modelo flagship con un prompt vago.

HUMANO: La decisión toca discrecionalidad, riesgo de discriminación, ámbito de consulta del Comité de Empresa o violación de umbrales. Análisis bajo Ley 15/2022 sobre igualdad de trato y ET art. 17 sobre no discriminación, ámbito de información al Comité de Empresa bajo ET art. 64, anomalía salarial por encima del límite pactado. El modelo prepara el caso; el humano firma la decisión.

Los siguientes ocho pasos son el patrón de enrutamiento representativo de una pipeline típica de 14 pasos. La tabla completa con las 14 reglas de enrutado vive en la configuración del Decision Layer del cliente.

Paso	Decisión	Capa	Destino de enrutado
1	Detectar tipos de documento en la subida	IA AUTÓNOMA	Mistral Small 3.2 on-prem
2	Extraer datos personales (nombre, dirección, fecha de nacimiento, NIF)	IA AUTÓNOMA	Mistral Small 3.2 on-prem
3	Validar formato NIF/NIE/CIF e IBAN según AEAT y normas bancarias	REGLAS	Motor de reglas, sin LLM
4	Clasificar tipo de contrato (indefinido, temporal, en prácticas, formación) bajo ET art. 14	IA AUTÓNOMA	Mistral Small 3.2
5	Comprobar cláusulas del contrato frente al convenio colectivo aplicable v2024-3	IA AUTÓNOMA	Mistral Medium 3.1 (La Plateforme)
6	Marcar cláusulas potencialmente discriminatorias bajo Ley 15/2022 y ET art. 17	HUMANO (preparado por IA)	Claude Opus 4.7 prepara el análisis, Director RRHH firma
7	Detectar anomalías salariales frente a rol/ubicación/antigüedad	IA AUTÓNOMA	Mistral Medium 3.1
8	Decidir si aplica información al Comité de Empresa bajo ET art. 64	HUMANO (preparado por IA)	Mistral Medium 3.1 pre-clasifica, enlace con Comité de Empresa firma

De los 14 pasos completos, seis son REGLAS (sin LLM: comprobación IBAN, completitud documental, presentaciones deterministas al Sistema RED de la TGSS y modelo 145 a la AEAT). Seis son IA AUTÓNOMA (Mistral Small o Medium). Dos son HUMANO con preparación por IA (Claude Opus para la cuestión de no discriminación bajo Ley 15/2022, Mistral Medium para la pre-clasificación de información al Comité de Empresa bajo ET art. 64).

En despliegues de hosting UE típicos, esta distribución se traduce en aproximadamente 1 a 3 EUR por onboarding en inferencia. Una arquitectura flagship-only (cada paso por Claude Opus) cae cerca de 25 a 40 EUR por onboarding - y procesa el paso 1 y el paso 2 sobre infraestructura estadounidense bajo exposición al CLOUD Act. Mismo resultado de negocio. Audit Trail distinto. Curva de coste distinta. Posición de soberanía distinta.

Ejemplo Banca - Pipeline de subscripción de crédito (18 microdecisiones)

Score Asnef = REGLAS. Match contra lista COAF/SEPBLAC = REGLAS. Clasificación perfil de riesgo basada en comportamiento transaccional = IA AUTÓNOMA con Mistral Small. Decisión final superior a 50.000 EUR = HUMANO con Ley del Cadastre Positivo considerada. Reporte COAF si patrón sospechoso = REGLAS bajo Ley 10/2010.

Qué ve el auditor: Decision Records bajo EU AI Act Art. 13

El artículo 13 del EU AI Act exige que los sistemas de IA de alto riesgo operen con transparencia suficiente para que los responsables del despliegue interpreten las salidas y las usen apropiadamente. El sistema debe venir con instrucciones que especifiquen métricas de precisión, robustez, niveles probados de ciberseguridad, medidas de supervisión humana bajo el artículo 14 y los recursos hardware requeridos.

La pregunta del auditor el día de la inspección no es “qué modelo usaron” sino “muéstreme el registro de decisión del caso de personal 2026-01-1873, paso 8”.

Un Decision Record producido por una capa de enrutado contiene, por micro-decisión:

Snapshot de entrada (los campos relevantes del contexto upstream, con manejo PII aplicado bajo RGPD)
Versión de la regla (qué versión del convenio colectivo o del marco de Comité de Empresa se usó; v2024-3)
Tipo de decisión (aplicación de regla, clasificación IA, razonamiento IA, aprobación humana)
Modelo usado (si IA: Mistral-Small-3.1-Instruct-2503, desplegado en clúster A04, región eu-de-fra)
Nivel de confianza (si IA: 0,94)
Cadena de razonamiento (si aplica: el razonamiento intermedio del modelo, capturado verbatim)
Resultado (etiqueta de clasificación, valor extraído o bandera de escalación)
Aprobador humano (si hubo escalación: nombre, rol, timestamp)
Botón de impugnación para decisiones IA (la persona afectada puede impugnar una decisión automatizada, lo que dispara una redecisión bajo revisión humana - el mecanismo exigido por el art. 22 RGPD)

Una pipeline que produce estos registros transforma la pregunta del modelo en una pregunta de enrutado. El auditor no pregunta “es Mistral tan bueno como Claude”. El auditor pregunta “está la decisión documentada end-to-end y se puede reproducir”. La pregunta del consejo va un paso más allá: quién firma la decisión cuando la Ley 15/2022 ha sido vulnerada por un destino de enrutado que debería haber escalado a un humano? La capa de enrutado hace esa firma trazable.

Para instituciones bajo supervisión del Banco de España y CNMV: la Circular 1/2024 BdE sobre Modelos Internos + DORA art. 28-30 (Subcontratación de servicios TIC) desde 17 enero 2025 + EBA Guidelines on Outsourcing (EBA/GL/2019/02) exigen registro de proveedores TIC. Para uso de Mistral La Plateforme: notificación obligatoria al Banco de España bajo Ley 10/2014 art. 26 si externalización es relevante. Decision Records cumplen documentación de los tres frameworks en paralelo.

Para operadoras de telecomunicaciones bajo supervisión CNMC: Ley General de Telecomunicaciones 11/2022 + Reglamento de Calidad de Servicio. AI en gestión de incidencias (Orden CNMC Resolución de calidad) + detección de fraude bajo Ley 11/2022 art. 41 son sistemas de alto riesgo bajo EU AI Act.

Para DPO bajo LOPDGDD: art. 35 RGPD DPIA es herramienta obligatoria para sistemas de IA de alto riesgo. AEPD ha emitido Resolución PS/00385/2023 sobre profiling automatizado y Resolución RR/00789/2024 sobre IA en RR.HH. TJUE C-634/21 SCHUFA (Dec 2023) confirma que decisión automatizada de scoring constituye “decisión automatizada” bajo art. 22 RGPD - la sentencia es referencia obligatoria. Resolución CD/ANPD 19/2024 estableció Cláusulas Contractuales Tipo brasileñas - para empresas con operaciones LATAM relevante.

La pregunta de arquitectura: Decision Layer o vendor lock-in

Una capa de Decision Layer model-agnóstica no es una feature. Es la precondición para casi todo lo enumerado en este artículo. Sin ella, los patrones de enrutado de arriba son abstractos.

Sin Decision Layer	Con Decision Layer
La elección del modelo se vuelve adhesiva. Cambiar de proveedor significa reimplementar el agente entero.	Cambiar de proveedor toma un cambio de configuración. Los modelos son intercambiables por paso de decisión.
La optimización de coste sucede a posteriori, renegociando con un vendor.	La optimización de coste está integrada: las decisiones de baja complejidad se enrutan automáticamente al modelo viable más barato.
La soberanía es binaria: o se acepta exposición al US CLOUD Act, o se autohospeda todo.	La soberanía es por decisión: pasos sensibles corren on-prem UE, pasos no sensibles pueden usar APIs cloud.
El Audit Trail existe en logs dispersos y se reconstruye bajo demanda.	El Audit Trail es el log de enrutado. El cumplimiento del artículo 13 EU AI Act es una consulta, no un proyecto.
Añadir un modelo nuevo significa una integración nueva.	Añadir un modelo nuevo significa añadirlo al router. Las reglas de enrutado ya existen.

Esta tabla muestra diferencias arquitectónicas, no juicios de calidad.

El Decision Layer es donde la elección de modelo se operacionaliza. El mercado de modelos cambia cada mes. Los precios bajan. Nuevos flagships se publican. La calidad open-weight alcanza al líder. Una arquitectura con Decision Layer absorbe ese cambio. Una arquitectura atada a un vendor paga el coste de migración cada vez.

En resumen

La pregunta interesante para un CIO o Director de Tecnología en una mediana empresa española en 2026 no es “Mistral o OpenAI”. Es “qué porcentaje de mis decisiones agénticas necesita razonamiento flagship, y cómo se lo demuestro a mi auditor”.

En un agente bien descompuesto, Mistral Small 3.2 sobre una única GPU UE hace la mayor parte del trabajo a coste por token negligible. Mistral Medium 3.1 sobre La Plateforme atiende la banda intermedia con soberanía UE preservada. Claude Opus 4.7 o GPT-5.5 atienden los casos genuinamente difíciles. El enrutado es la arquitectura. El Audit Trail es el artefacto de cumplimiento. El Decision Layer es el lugar donde todo eso se especifica.

Otros publican tablas comparativas de modelos. Nosotros construimos la capa de enrutado que las operacionaliza. El mercado de modelos cambia cada mes; la arquitectura de enrutado sobrevive a cinco generaciones de modelos. El código fuente queda con el cliente. Los modelos siguen intercambiables. El cumplimiento del artículo 13 del EU AI Act es una propiedad de la arquitectura, no un proyecto al final.

Si quieres saber cómo se ve realmente la distribución de complejidad de tu agente, reserva una consulta.

Bert Gogolin

Director General, Gosign

AI Governance Briefing

IA empresarial, regulación e infraestructura - una vez al mes, directamente de mi parte.