Pular para o conteúdo
Infraestrutura & Tecnologia

Quando Mistral, quando Claude Opus? Decision Routing para a empresa brasileira 2026

Decisões agênticas decompostas: Mistral Small em on-prem soberano cobre 70%, Claude Opus fica para os 10% com carga real de raciocínio. Decision Records prontos para LGPD art. 20.

Bert Gogolin
Bert Gogolin
CEO e fundador 13 min de leitura

O mercado de modelos amadureceu mais rápido que a maioria das arquiteturas empresariais. Claude Opus 4.7, GPT-5.5 e Gemini 3.1 Pro convergem em qualidade. Mistral La Plateforme opera de um data center francês sob jurisdição europeia. A OpenAI liberou o gpt-oss sob Apache 2.0 em agosto de 2025. Meta e Mistral lançaram modelos open-weight que rodam em uma única GPU e atingem qualidade de produção.

Mesmo assim, a maioria dos projetos enterprise de IA ainda escolhe um modelo e roteia toda a carga por ele. Essa escolha determina silenciosamente três outras coisas: sua posição de soberania de dados, o seu custo de auditoria sob LGPD e EU AI Act, e o espaço que sobra para otimização de custo. Escolher um modelo não é uma decisão de modelo. É uma decisão de arquitetura.

Em resumo - Stack agêntico para a empresa brasileira em 2026

  • Cerca de 70% das decisões agênticas em um workflow enterprise bem decomposto são aplicação de regra ou extração estruturada. Em setups típicos de hosting soberano, Mistral Small 3.2 em uma única GPU resolve isso por aproximadamente 1/30 do preço de lista do Claude Opus.
  • Mistral tem duas superfícies de deployment distintas: La Plateforme (API EU-hosted em infraestrutura francesa, com data center dedicado em Bruyères-le-Châtel a partir do Q2 2026) e Mistral Small 3.2 (Apache 2.0, totalmente self-hostável, 24B parâmetros).
  • Os 8 a 10% de decisões que sobram - raciocínio complexo, análise multi-jurisdição, escalonamento de casos limite - justificam Claude Opus 4.7 ou GPT-5.5. É aí que o token spend é justificado, não desperdiçado.
  • A exposição ao US CLOUD Act se aplica até mesmo a deployments na região EU de provedores americanos. Schrems II tornou isso concreto. Self-hosting de Mistral Small, gpt-oss-120b ou DeepSeek V4-Flash (preview de abril de 2026, MIT, 284B/13B active MoE) é a única arquitetura com zero superfície de CLOUD Act - relevante para transferências internacionais sob LGPD art. 33 quando o controlador brasileiro é subsidiária de grupo americano.
  • LGPD art. 20 (alterado pela Lei 13.853/2019) exige revisão de decisões automatizadas que afetem interesses do titular - a revisão pode ser humana ou por outro sistema automatizado, desde que com transparência. EU AI Act Art. 13 exige operação transparente para sistemas de alto risco. Uma camada de Decision Routing produz o artefato de auditoria: registro por decisão com input, versão da regra, modelo, confiança e aprovador (humano ou sistêmico) onde houve escalonamento.

Você avalia Mistral - o que avalia de verdade é sua estratégia de soberania

O caminho típico de uma avaliação em 2026 começa assim. O Jurídico pede uma alternativa à OpenAI compatível com LGPD em casos de transferência internacional. Compras compila pitches de fornecedores. Arquitetura começa a avaliar Mistral. Em uma semana a conversa migrou de “qual modelo” para “qual nossa posição diante do US CLOUD Act” e “como operacionalizamos LGPD art. 20 e EU AI Act Art. 13 para sistemas de alto risco em filiais europeias.”

O CLOUD Act segue o controle do provedor, não a localização do dado. Um provedor americano com data centers na União Europeia - Azure OpenAI EU, AWS Bedrock Frankfurt, GCP Vertex europe-west - pode ser obrigado a entregar dados sob ordem judicial americana. A Comissão Europeia deve publicar um Tech Sovereignty Package no Q2 2026, restringindo o uso de provedores americanos por órgãos públicos em saúde, finanças e justiça. Compras corporativas estão lendo esses sinais.

AWS Brazil South (São Paulo) é uma questão central para fintech sob BACEN: a região é Brasil, mas Amazon Web Services Brasil Ltda é controlada pela Amazon.com Inc (US). CLOUD Act aplica-se. BACEN Resolução 4.893 art. 11 fala de “infraestrutura crítica em território nacional” para alguns serviços - AWS Brazil pode ou não atender dependendo de cláusulas contratuais reforçadas. Para fintech, Auditoria BACEN exige clarificação prévia: controlador legal sob LGPD art. 33 quando a contratante é AWS Brasil mas casa-mãe é Inc.? O mesmo raciocínio se aplica a Azure Brazil South e GCP São Paulo. Para dados pessoais sensíveis ou para tratamento sob regime BACEN, a posição defensável de Compras é: hyperscaler em região BR exige cláusulas contratuais reforçadas (residência ponta a ponta, vedação de acesso pela matriz, plano de saída) ou substituição por provedor nacional puro (Locaweb, Equinix SP colocation, SERPRO, Dataprev para estatais).

Mistral interessa não porque vence Claude num leaderboard. Interessa porque ocupa uma posição que nenhum provedor americano consegue ocupar: um provedor europeu de fronteira com infraestrutura dedicada na UE e uma linha de modelos open-weight sob Apache 2.0. A partir do Q2 2026, a empresa opera o próprio data center perto de Paris com 13.800 GPUs NVIDIA GB300 e 44 megawatts de capacidade. Isso torna Mistral o único provedor de fronteira que oferece residência ponta a ponta na UE em infraestrutura própria sob jurisdição europeia.

Mas isso ainda enquadra a pergunta de forma errada. A pergunta real não é “Mistral ou OpenAI”. É “quais decisões vão para onde, e como você prova isso ao auditor independente, à ANPD ou ao Encarregado de Dados (DPO)”.

Mistral são dois mundos: La Plateforme na França ou Mistral Small Apache 2.0

A confusão começa quando se trata “Mistral” como um produto único. São duas famílias de produto com superfícies de deployment diferentes e implicações de compliance diferentes.

Produto MistralDeploymentLicença / custoSoberano
Mistral Medium 3.1La Plateforme (API hosted na França) ou Azure AI FoundryToken-based, proprietárioSim via La Plateforme
Mistral Small 3.2Self-hosted on-premApache 2.0, só custo de GPUSim se hardware na UE ou Brasil
Mixtral 8x22BSelf-hosted on-premApache 2.0, só custo de GPUSim se hardware na UE ou Brasil
CodestralLa PlateformeToken-based, proprietárioSim via La Plateforme

“Soberano” significa aqui: fora do alcance do US CLOUD Act. Tanto La Plateforme (jurisdição francesa) quanto self-hosted em hardware na UE ou em data center brasileiro qualificam. Azure AI Foundry não qualifica, mesmo com residência na EU, porque a Microsoft permanece sujeita ao CLOUD Act.

Mistral Medium 3.1 é o flagship proprietário. Roda na infraestrutura francesa da Mistral, acessado por API. Token-billed. Soberano por padrão. A partir do Q2 2026, o data center dedicado em Bruyères-le-Châtel atende clientes que exigem garantia de residência francesa.

Mistral Small 3.2 é o open-weight workhorse. 24 bilhões de parâmetros. Contexto de 128K tokens. Vision incluído. Lançado em março de 2025 sob Apache 2.0. Roda em uma única NVIDIA RTX 4090 ou em um Mac com 32 GB de RAM. Throughput de cerca de 150 tokens por segundo em hardware consumer.

Os dois não são redundantes. La Plateforme faz sentido quando você quer soberania na UE sem operar infraestrutura GPU. Mistral Small 3.2 faz sentido quando a decisão tem volume tão alto que o token billing vira o cost driver, ou quando o dado é tão sensível que mesmo tráfego de API para a UE é superfície demais.

A pergunta de arquitetura é qual superfície de deployment para qual decisão, não qual provedor para qual leaderboard.

Comparação de perfis de modelos em seis dimensões enterprise (maio 2026) Spider-chart comparando quatro modelos representativos em seis dimensões relevantes para empresa, pontuados de 0 a 10. Claude Opus 4.7 (nuvem, Anthropic): Raciocínio 10, Codificação 10, Multimodal 7, Eficiência de custo 3, Latência 6, Soberania UE 4. GPT-5.5 (nuvem, OpenAI/Azure): Raciocínio 10, Codificação 10, Multimodal 9, Eficiência 3, Latência 7, Soberania 4. Mistral Small 3.2 (self-host, Apache 2.0): Raciocínio 6, Codificação 7, Multimodal 8, Eficiência 10, Latência 9, Soberania 10. DeepSeek V4-Pro (self-host, MIT): Raciocínio 9, Codificação 8, Multimodal 5, Eficiência 7, Latência 7, Soberania 9. Os flagships cloud dominam em Raciocínio, Codificação e Multimodal mas perdem em Eficiência de custo e Soberania UE. Os modelos self-host invertem esse padrão. A camada de routing combina ambas as formas por micro-decisão em vez de escolher um campeão. 108642 Raciocínio Codificação Multimodal Eficiência de custo Latência inferência Soberania UE Claude Opus 4.7nuvem, Anthropic GPT-5.5nuvem, OpenAI/Azure Mistral Small 3.2self-host, Apache 2.0 DeepSeek V4-Proself-host, MIT
Perfil de modelo em seis dimensões enterprise - vista comparativa estilo c't, pontuada de 0 a 10. Os flagships cloud (Claude Opus 4.7, GPT-5.5) dominam em Raciocínio, Codificação, Multimodal, mas perdem em Eficiência de custo e Soberania UE. Os modelos self-host (Mistral Small 3.2, DeepSeek V4-Pro) invertem essa forma. Não existe modelo "melhor" - a camada de routing escolhe a forma certa por micro-decisão.

Por que Mistral Small como default, não gpt-oss ou DeepSeek

Uma pergunta justa depois de decidir self-hosting: por que Mistral Small 3.2 ganha o posto de workhorse sobre gpt-oss-120b (Apache 2.0, 117B params MoE, 5 de agosto de 2025) ou DeepSeek V4 (MIT, preview de 24 de abril de 2026; V4-Flash 284B/13B active, V4-Pro 1.6T/49B active, contexto de 1M)? Os três são legitimamente self-hostáveis em alguma configuração. A diferenciação está em hardware floor, cobertura de idiomas e modalidade.

Modelo open-sourceHardware floorForçaFraquezaSweet spot
Mistral Small 3.2 (24B, Apache 2.0)1× RTX 4090 (~1.500 EUR one-time) ou Mac M2/M3 32GBVolume, multilíngue (PT-BR/EN/ES/FR/DE), com vision, ~150 tok/sNão é raciocínio de topoWorkhorse default para a faixa de 70% de volume
gpt-oss-120b (117B MoE, Apache 2.0)1× H100/A100 80GB (~30k EUR ou ~1.200 EUR/mês hosted)Raciocínio nível o4-mini, eficiência MoESem vision, hardware grau data center obrigatórioAlternativa heavy-reasoning ao Claude Opus quando até isso tem que ficar on-prem
DeepSeek V4-Flash (MIT, preview Abr 2026)1-2× H100/A100 80GB com quantRaciocínio de fronteira em hardware moderado, contexto 1M, multimodal nativoStatus preview - benchmarks precisam ser reverificados antes de produçãoEspecialista em matemática/lógica + análise de portfólio com contexto 1M
DeepSeek V4-Pro (MIT, preview Abr 2026)Cluster multi-GPU (8× H100, ~240.000 EUR CAPEX ou ~10-12k EUR/mês hospedado)Aproxima performance de GPT-5.5/Gemini 3.1 Pro, otimizado para agent-toolingHardware classe hyperscaler; PME via API/hospedado é o caminho realistaRaciocínio de fronteira sob licença aberta - grande empresa on-prem, PME via API
Llama 4 Scout (Meta Llama License)1× GPUContexto de 10M tokensRestrição de licença acima de 700M MAUContexto ultra-longo para portfólios contratuais inteiros

Três razões concretas para Mistral Small assumir o default:

Hardware threshold. Mistral Small roda em silício consumer. gpt-oss-120b precisa de GPU data center. Para um pipeline enterprise com cinco a dez worker nodes, o delta de hardware por nó é significativo. Quando 70% das decisões são classificação ou extração, capacidade de raciocínio gpt-oss-grade é overkill para o trabalho de volume.

Corpus de treinamento multilíngue. Mistral foi treinado desde o início com dados em francês, alemão, espanhol e italiano - e cobre português europeu e brasileiro de forma muito mais consistente que gpt-oss. gpt-oss é US-centric, com treinamento dominantemente em inglês. Para um pipeline brasileiro processando documentos em português com nomenclatura jurídica brasileira (CLT, CPF, IRRF), Mistral Small é o workhorse melhor no dia um.

Vision incluído. Mistral Small 3.2 tem capacidade nativa de vision. gpt-oss não. Para onboarding de pessoal (RG, CPF, comprovante de residência, ASO, certificados), folha de pagamento (holerites em PDF) ou financeiro (notas fiscais com layout específico), isso é nocaute.

gpt-oss-120b ou DeepSeek V4-Flash entram no stack como opção on-prem de raciocínio pesado quando a API do Claude Opus 4.7 não pode ser usada por motivo de compliance. DeepSeek V4-Pro chega perto de performance frontier-closed-source sob licença MIT, mas seu hardware floor (cluster de 8× H100, cerca de 240.000 EUR CAPEX ou 10-12k EUR/mês em hospedagem dedicada) define a fronteira por tamanho de empresa, não por licença: para grande empresa B3 e média empresa superior, esses 240k EUR são item-orçamento-TI padrão; para PME abaixo de 500 funcionários, V4-Pro via API ou hospedado (Together.ai, Fireworks, DeepSeek API) é o caminho realista. Nenhum deles substitui o Mistral Small como workhorse de volume - eles complementam para as decisões mais duras. O comparativo detalhado de self-hosted está em IA open-source auto-hospedada 2026: Mistral, gpt-oss, DeepSeek V4, Llama 4 no stack enterprise (artigo separado).

Qual modelo para o quê? A distribuição de complexidade das decisões agênticas

Um agente enterprise típico se decompõe em 14 a 50 microdecisões. A complexidade não está distribuída de forma uniforme. Em um pipeline de RH ou Financeiro bem instrumentado, ela segue um padrão que medimos consistentemente:

Tipo de decisãoFatia das decisõesComplexidadeMelhor modeloCusto real por 1M tokens
Aplicação de regra (faixa de IRRF a partir do salário, classificação de tipo de contrato CLT, verificação de limite)50%BaixaMuitas vezes sem LLM; senão Mistral Small 3.2, Llama 4 Scout, gpt-oss-20b~0 a ~0,50 USD
Extração estruturada (extração de campos de PDF, normalização de tabelas, line items corrigidos por OCR)25%MédiaMistral Small 3.2, Mistral Medium 3.1, gpt-oss-120b~0,50 a ~2 USD
Classificação contextual (revisão de cláusula contratual contra ACT - ou CCT na ausência de ACT próprio - vigente, detecção de anomalias em despesas, flags de risco de fornecedor)15%Média-altaMistral Medium 3.1, Claude Haiku 4.5, GPT-5 mini~1 a ~5 USD
Raciocínio complexo (análise cross-jurisdição Lei 14.611/2023 + Lei 9.029/1995, síntese argumentativa multi-etapa, redação de escalonamento)8%AltaClaude Opus 4.7, GPT-5.5~15 a ~25 USD
Multimodal (correlação imagem + texto, segmentos de vídeo, revisão de desenho técnico)2%AltaGemini 3.1 Pro~5 a ~10 USD

A implicação é simples. Se você rotear toda decisão para Claude Opus, paga tarifa flagship para os 75% de trabalho que não precisam de raciocínio flagship. Se rotear toda decisão para Mistral Small, economiza em token mas falha nos 8% em que o raciocínio classe Opus realmente importa - e paga o preço em achados de auditoria, não em tokens.

O Stanford HAI AI Index 2025 registra que 65,7% dos foundation models lançados em 2023 foram open-source, contra 33,3% em 2021. A adoção enterprise de IA passou de 78%. O mercado não escolhe mais entre proprietário e aberto. Está escolhendo como compor os dois.

Mistral Small como workhorse: um agente de admissão com 14 microdecisões

Exemplo concreto. Um agente de admissão recebe o contrato assinado de um novo empregado mais documentação de apoio (cópia de RG e CPF, comprovante de residência, ASO admissional, comprovantes de qualificação). Sua tarefa: produzir o registro de empregado conforme CLT art. 41, rodar checks de compliance pré-emprego, agendar onboarding, gerar o evento eSocial S-2200. Quatorze microdecisões no total, indo de validação regex até análise de risco antidiscriminatório sob Lei 9.029/1995 e Lei 14.611/2023 (igualdade salarial).

Uma implementação ingênua manda cada etapa para Claude Opus 4.7. Uma implementação decomposta roteia por etapa. A Decision Layer guarda as regras de roteamento: toda etapa é classificada como REGRAS, IA AUTÔNOMA ou HUMANO antes de executar.

REGRAS: A decisão é determinística. CPF segue dígito verificador específico. Faixa de IRRF segue tabela progressiva publicada pela Receita Federal. Sem interpretação, sem modelo necessário. Aqui o agente é executor, não raciocinador.

IA AUTÔNOMA: A decisão é classificação ou extração com confiança suficiente. Detecção de tipo de documento, classificação de tipo de contrato (CLT, PJ, estagiário, jovem aprendiz), extração estruturada de campos. Um modelo pequeno com schema claro vence um modelo flagship com prompt vago.

HUMANO: A decisão envolve discricionariedade, risco de discriminação, escopo de negociação coletiva ou violação de limite. Análise de discriminação sob Lei 9.029/1995, verificação de equidade salarial sob Lei 14.611/2023, notificação ao Sindicato laboral (referência: ACT da empresa se houver, ou CCT da categoria), anomalia salarial acima do limite acordado. O modelo prepara o caso; o humano assina a decisão.

As oito etapas a seguir são o padrão representativo de roteamento de um pipeline típico de 14 etapas. A tabela completa fica na configuração do Decision Layer do cliente.

EtapaDecisãoCamadaAlvo de roteamento
1Detectar tipos de documento no uploadIA AUTÔNOMAMistral Small 3.2 on-prem
2Extrair dados pessoais (nome, endereço, data de nascimento, CPF, RG)IA AUTÔNOMAMistral Small 3.2 on-prem
3Validar dígito verificador do CPF, formato do PIS/NIS, faixa de IRRFREGRASEngine de regras, sem LLM
4Classificar tipo de contrato (prazo determinado, indeterminado, experiência, intermitente)IA AUTÔNOMAMistral Small 3.2
5Conferir cláusulas contratuais contra o ACT (ou CCT, se não houver ACT próprio) vigente v2024-3IA AUTÔNOMAMistral Medium 3.1 (La Plateforme)
6Sinalizar cláusulas potencialmente discriminatórias sob Lei 9.029/1995 e Lei 14.611/2023HUMANO (preparado por IA)Claude Opus 4.7 redige a análise, Diretor Jurídico assina
7Detectar anomalias salariais em relação a cargo/localização/senioridade (Lei 14.611/2023)IA AUTÔNOMAMistral Medium 3.1
8Classificar dados sensíveis no ASO admissional (art. 11 LGPD) e decidir comunicação à CIPA por enquadramento de riscoHUMANO (preparado por IA)Mistral Medium 3.1 pré-classifica, Encarregado de Dados + representante da CIPA assinam

ACT (Acordo Coletivo de Trabalho entre empresa e sindicato laboral) prevalece sobre CCT (Convenção Coletiva entre sindicato patronal e sindicato laboral) por força de CLT art. 620 - para multinacional com ACT próprio, o documento de referência da etapa 5 é o ACT, não a CCT da categoria. A camada de roteamento deve carregar a versão correta do instrumento coletivo aplicável ao empregador, não a versão genérica da categoria sindical.

ASO (Atestado de Saúde Ocupacional) = dado pessoal sensível sob art. 11 LGPD. Tratamento exige bases jurídicas restritas: consentimento expresso (art. 11 I) ou cumprimento de obrigação legal (art. 11 II - NR-7 obriga ASO admissional). Decision Layer deve mapear esta classificação especificamente, separando o fluxo do ASO do fluxo dos demais documentos (RG, CPF, comprovante de residência) que não são sensíveis.

Das 14 etapas totais, seis são REGRAS (sem LLM: validação de CPF, completude documental, gravação determinística do evento eSocial S-2200). Seis são IA AUTÔNOMA (Mistral Small ou Medium). Duas são HUMANO-com-IA-prep (Claude Opus para a análise de equidade salarial, Mistral Medium para a pré-classificação CIPA).

Em setups de hosting típicos com soberania preservada, essa distribuição dá aproximadamente 1 a 3 USD por admissão em inferência. Uma arquitetura flagship-only (cada etapa via Claude Opus) chega perto de 25 a 40 USD por admissão - e processa as etapas 1 e 2 em infraestrutura americana sob exposição ao CLOUD Act. Mesmo resultado de negócio. Audit trail diferente. Curva de custo diferente. Posição de soberania diferente.

O que o auditor vê: Decision Records sob LGPD art. 20 e EU AI Act Art. 13

LGPD art. 20 dá ao titular o direito de solicitar revisão de decisões tomadas unicamente com base em tratamento automatizado de dados pessoais. EU AI Act Article 13 exige que sistemas de IA de alto risco operem de forma transparente o suficiente para que os deployers consigam interpretar os outputs e usá-los adequadamente. O sistema deve ser entregue com instruções especificando métricas de acurácia, robustez, níveis de cibersegurança testados, medidas de supervisão humana sob Art. 14 e recursos de hardware exigidos.

Importante: Lei 13.853/2019 retirou do art. 20 §3º a exigência de revisão “por pessoa natural” - hoje a revisão pode ser realizada por outro sistema automatizado, desde que com transparência. Esse é o ponto onde toda decisão ANPD pivota: o artigo não obriga mais revisão humana absoluta, mas exige que o titular tenha acesso a critérios claros sobre como a decisão (automatizada ou não) foi tomada. Para o Encarregado de Dados, isso muda a economia da supervisão humana: a obrigação de design não é “humano em loop sempre”, mas “transparência reproduzível sempre, com escalonamento humano onde a decisão materialmente afeta direitos”.

A pergunta do auditor no dia da inspeção não é “qual modelo você usou” mas “me mostre o decision record do caso de admissão 2026-01-1873, etapa 8”.

Um Decision Record produzido por uma camada de roteamento contém, por microdecisão:

  • Snapshot do input (os campos relevantes do contexto upstream, com tratamento de dados pessoais aplicado conforme LGPD)
  • Versão da regra (qual versão da CCT/ACT foi usada; v2024-3)
  • Tipo de decisão (aplicação de regra, classificação por IA, raciocínio por IA, aprovação humana)
  • Modelo usado (se IA: Mistral-Small-3.1-Instruct-2503, deployed no cluster A04, região eu-de-fra ou br-sao-1)
  • Score de confiança (se IA: 0,94)
  • Cadeia de raciocínio (quando aplicável: o raciocínio intermediário do modelo, capturado literalmente)
  • Resultado (label de classificação, valor extraído ou flag de escalonamento)
  • Aprovador humano (se escalado: nome, papel, timestamp)
  • Botão de contestação para decisões de IA (o titular pode contestar uma decisão automatizada, o que dispara nova decisão sob revisão - humana ou por outro sistema automatizado conforme Lei 13.853/2019, com transparência sobre os critérios, conforme exigido pela LGPD art. 20)

Um pipeline que produz esses registros transforma a pergunta de modelo em pergunta de roteamento. O auditor não pergunta “Mistral é tão bom quanto Claude”. O auditor pergunta “a decisão está documentada ponta a ponta e pode ser reproduzida”. A pergunta do conselho vai um passo além: quem assina a decisão quando a Lei 14.611/2023 (igualdade salarial) foi violada por um alvo de roteamento que deveria ter escalado para um humano? A camada de roteamento torna essa assinatura rastreável.

Para fintechs e instituições financeiras sob BACEN

Para fintechs e instituições financeiras sob BACEN: Resolução 4.658/2018 (Política de Cibersegurança) + Resolução 4.893/2021 (Cibernética em Arranjos de Pagamento) + Circular 3.909 sobre infraestrutura crítica em território nacional aplicam-se. Open Finance Brasil Fase 4 ativa desde 2024 exige Decision Records para classificação automatizada de transações. CMN Resolução 4.893 art. 11-14 sobre contratação de serviços relevantes de TI obriga: cláusula de auditoria BACEN, direito de exigir dados, plano de saída em contrato de fornecedor. A camada de roteamento que emite Decision Records reutilizáveis cobre exatamente esse ponto - é o artefato que a auditoria BACEN inspeciona quando questiona “como a decisão de classificação de transação X foi tomada e por qual modelo”.

Para empresas controladas pela União (estatais, infraestrutura crítica)

Para empresas controladas pela União (estatais energia, infraestrutura crítica): ANEEL Resolução 956/2021 (Plano de Continuidade de Negócio + Plano de Resposta a Incidentes + reporte ANEEL em até 72h após incidente material). TCU jurisprudência (Acórdão 1.739/2015, 2.952/2018, 1.388/2022) sobre cloud público para órgãos federais. Lei 14.133/2021 (Nova Lei de Licitações) rege contratação. Decreto 11.856/2023 (Estratégia Brasileira de IA - EBIA) estabelece governança. SERPRO (SerproCloud) + Dataprev são opções soberanas obrigatórias antes de hyperscaler para dados classificados sob Lei 12.527/2011 e Decreto 7.845/2012. Para o Diretor de TI de estatal, a sequência de avaliação é: SERPRO ou Dataprev primeiro, T-Systems/IONOS sovereign em segundo, hyperscaler em região BR só com cláusulas reforçadas e parecer jurídico explícito.

Para o Encarregado de Dados: RIPD, CPCs e sanções ANPD

Para Encarregado de Dados: Resolução CD/ANPD 18/2024 estabelece Relatório de Impacto à Proteção de Dados (RIPD - art. 38 LGPD) obrigatório para tratamento de risco aumentado. Sistemas de IA com decisão automatizada que afeta titulares = risco aumentado. Resolução CD/ANPD 19/2024 introduziu Cláusulas-Padrão Contratuais brasileiras (CPCs) para transferência internacional - são o framework principal aprovado pela ANPD desde agosto/2024, não opcionais. Resolução CD/ANPD 4/2023 define sanções: multa até 2% do faturamento, máximo R$ 50 milhões por infração. Para Encarregado: art. 7 IX LGPD (legítimo interesse) + teste de proporcionalidade art. 10 §3º = base jurídica mais utilizada para IA sem consentimento. Trabalho central do Encarregado: documentar este teste no RIPD - é o artefato que materializa a defesa em fiscalização ANPD.

A pergunta de arquitetura: Decision Layer ou vendor lock-in

Uma Decision Layer model-agnostic não é um feature. É a precondição para quase tudo listado neste artigo. Sem ela, os padrões de roteamento acima ficam abstratos.

Sem Decision LayerCom Decision Layer
A escolha de modelo gruda. Trocar provedor significa reimplementar o agente inteiro.Trocar provedor é mudança de configuração. Modelos são intercambiáveis por etapa de decisão.
A otimização de custo acontece depois, em renegociação com um único vendor.A otimização de custo é built-in: decisões de baixa complexidade roteiam automaticamente para o modelo viável mais barato.
Soberania é binária: ou você aceita a exposição ao US CLOUD Act, ou hospeda tudo.Soberania é por decisão: etapas sensíveis rodam em on-prem soberano, etapas não sensíveis podem usar APIs cloud.
Audit trail existe em logs espalhados e é reconstruído sob demanda.Audit trail é o log de roteamento. Compliance com LGPD art. 20 e EU AI Act Art. 13 vira consulta, não projeto.
Adicionar um novo modelo é uma nova integração.Adicionar um novo modelo é colocá-lo no router. As regras de roteamento já existem.

Essa tabela mostra diferenças arquiteturais, não julgamentos de qualidade.

A Decision Layer é onde a escolha de modelo é operacionalizada. O mercado de modelos muda mês a mês. Preços caem. Novos flagships são lançados. Qualidade open-weight alcança. Uma arquitetura Decision Layer absorve essa mudança. Uma arquitetura vendor-bound paga o custo de migração toda vez.

Conclusão

A pergunta interessante para um CIO/CTO de empresa brasileira em 2026 não é “Mistral ou OpenAI”. É “que porcentagem das minhas decisões agênticas precisa de raciocínio flagship, e como eu provo isso ao meu Encarregado de Dados (DPO), ao auditor independente e à ANPD”.

Em um agente bem decomposto, Mistral Small 3.2 em uma única GPU faz a maior parte do trabalho por custo por token desprezível. Mistral Medium 3.1 em La Plateforme cobre a faixa média com soberania europeia preservada - relevante para multinacionais brasileiras com operação na UE. Claude Opus 4.7 ou GPT-5.5 atendem os casos genuinamente difíceis. O roteamento é a arquitetura. O audit trail é o artefato de compliance. A Decision Layer é o lugar onde tudo isso é especificado.

Outros publicam tabelas de comparação de modelo. A gente constrói a camada de roteamento que operacionaliza essas tabelas. O mercado de modelos muda mês a mês; a arquitetura de roteamento sobrevive a cinco gerações de modelo. O código-fonte fica com o cliente. Os modelos permanecem intercambiáveis. Conformidade com LGPD art. 20 e EU AI Act Art. 13 é uma propriedade da arquitetura, não um projeto no fim.

Se você quer saber como é a distribuição de complexidade real do seu agente, agende uma conversa.

Bert Gogolin

Bert Gogolin

Diretor Executivo, Gosign

AI Governance Briefing

IA empresarial, regulamentação e infraestrutura - uma vez por mês, diretamente de mim.

Sem spam. Cancelável a qualquer momento. Política de privacidade

Mistral Claude GPT-5 gpt-oss DeepSeek Decision Layer LGPD EU AI Act CLOUD Act Model Routing 2026
Compartilhar este artigo

Perguntas frequentes

Quando faz sentido usar Mistral em vez de Claude ou GPT-5?

Mistral é o cavalo de trabalho para cerca de 70% das decisões agênticas se você decompõe o agente corretamente: aplicação de regras, extração estruturada, classificação. Claude Opus 4.7 ou GPT-5.5 ficam para os 8 a 10% com carga real de raciocínio. A pergunta não é qual modelo é melhor, mas qual modelo para qual microdecisão.

Mistral é realmente soberano em relação a dados?

Mistral La Plateforme roda por padrão em infraestrutura francesa sob jurisdição europeia. A partir do Q2 2026, a empresa opera o próprio data center em Bruyères-le-Châtel, ao sul de Paris, com 13.800 GPUs NVIDIA GB300 e 44 megawatts. O Mistral Small 3.2 é licenciado Apache 2.0 e roda totalmente self-hosted em uma única RTX 4090. Ambas as opções ficam fora do alcance do US CLOUD Act, diferentemente do Azure OpenAI EU. Para multinacionais brasileiras com operações na Europa, isso muda a matriz de transferência internacional sob LGPD art. 33.

O que é o gpt-oss e como ele se diferencia do Mistral?

gpt-oss-120b é o primeiro modelo open-weight da OpenAI desde o GPT-2, lançado em 5 de agosto de 2025 sob Apache 2.0. Atinge raciocínio no nível do o4-mini em uma única GPU de 80 GB. Comparado com Mistral Small 3.2 (24B parâmetros, roda em uma única GPU consumer), o gpt-oss-120b mira cargas de raciocínio mais pesadas. Ambos são opções legítimas de self-hosting para soberania de dados brasileira sob LGPD.

Como o Decision Routing satisfaz a LGPD art. 20 e o EU AI Act Art. 13?

LGPD art. 20 dá ao titular o direito de solicitar revisão de decisões tomadas unicamente com base em tratamento automatizado. Lei 13.853/2019 retirou a exigência de revisão por pessoa natural - hoje a revisão pode ser realizada por outro sistema automatizado, desde que com transparência. O Art. 13 do EU AI Act exige que sistemas de IA de alto risco operem de forma transparente para que os usuários consigam interpretar os outputs. Uma camada de Decision Routing atende as duas obrigações ao mesmo tempo: cada decisão é registrada com input, versão da regra, modelo usado, score de confiança (se IA), cadeia de raciocínio (quando aplicável) e responsável humano (se houve escalonamento). O audit trail é o artefato técnico exigido pelos dois marcos - e o RIPD (Resolução CD/ANPD 18/2024) é o instrumento que o Encarregado de Dados usa para documentar o tratamento de risco aumentado.

Qual processo seu primeiro agente deveria gerenciar?

Deixe seu email - você receberá seu link pessoal de agendamento instantaneamente.