Infraestrutura de IA:
Manual de Governança
para o CTO

Build, Buy, Hybrid - infraestrutura de IA
em conformidade regulatória

Autora: Theandra Moreira, Diretora de Consultoria
Editora: Gosign GmbH, Hamburgo
Data: Março 2026
Extensão: 28 páginas

Sumário

1 Por que o CTO deve liderar a governança de infraestrutura de IA
2 Build, Buy, Hybrid: o framework B/B/H
3 EU AI Act e PL 2338/2023: 6 requisitos técnicos
4 Security & Data Sovereignty
5 4 padrões de infraestrutura em produção
6 Infrastructure Readiness Assessment
7 Próximos passos
644 bi
USD em gastos com infraestrutura de IA até 2027
Gartner 2024
28%
dos gastos em nuvem são desperdiçados
Flexera 2024
40%
dos incidentes de segurança por configuração incorreta
ENISA 2024

1 - Por que o CTO deve liderar a governança de infraestrutura de IA

A infraestrutura de IA cresce mais rápido do que as estruturas de governança que a controlam.

Segundo a HashiCorp (2024), 82% das empresas operam ambientes multi-cloud - mas apenas 31% possuem uma estratégia centralizada de governança. O resultado: Shadow AI. Departamentos utilizam APIs de LLM externas sem aprovação. Equipes de Data Science implantam modelos em endpoints não controlados.

O Stanford HAI AI Index Report (2025) documenta: os investimentos em infraestrutura de IA crescem 29% ao ano, mas os orçamentos de governança crescem apenas 8%. Essa disparidade gera dívida técnica.

Três níveis de governança

NívelResponsabilidadeQuem
Governança de ArquiteturaPadrões, modelos e APIs aprovadosCTO + Enterprise Architecture
Governança de OperaçõesSLAs, monitoramento, resposta a incidentes, gestão de custosInfrastructure + DevOps
Governança de ComplianceEU AI Act, PL 2338/2023, LGPD, trilha de auditoria, residência de dadosCTO + CISO + Jurídico
Governança de CustosOrçamentação, chargeback, detecção de desperdícioFinOps + CTO
Governança de SegurançaZero Trust, criptografia, gestão de acessoCISO + Plataforma
Checklist do CTO

Antes de colocar o primeiro agente de IA em produção:

Segundo a Flexera (2024), as empresas desperdiçam em média 28% dos seus gastos em nuvem. Em workloads de IA com instâncias GPU, a taxa de desperdício é ainda maior.

2 - Build, Buy, Hybrid: o framework B/B/H

Cada componente da infraestrutura de IA exige uma decisão fundamental: construir internamente, comprar ou combinar.

CritérioBuildBuyHybrid
ControleTotalLimitadoDiferenciado
Residência de DadosGarantidaDependente do contratoControlável
Time-to-Value3 a 6 meses1 a 4 semanas4 a 8 semanas
Custos operacionaisFixos + pessoalVariável (Pay-per-Use)Misto
Vendor Lock-inNenhumAltoMédio

Matriz de decisão por workload

WorkloadRecomendaçãoJustificativa
LLM Inference (padrão)BuyCusto-benefício com volume variável
LLM Inference (sensível)BuildOs dados não podem sair do território nacional ou da UE
Agent OrchestrationHybridFramework self-hosted, chamadas de LLM roteadas
Document IntelligenceBuildDocumentos contêm dados pessoais (PII)
Vector DatabaseHybridGerenciado para dados não sensíveis, self-hosted para PII
MonitoramentoBuyFerramentas especializadas com região local ou UE

Custos ocultos e riscos ocultos

Build - Custos ocultos

Hardware GPU: NVIDIA H100: 25.000 a 40.000 USD por placa. Cluster de produção: mínimo de 4 a 8 placas.

Pessoal: Engenheiros de MLOps, engenheiros de plataforma, especialistas em segurança. 40% das empresas não possuem as competências necessárias (Gartner 2024).

Manutenção: Atualizações de modelos, patches de segurança, upgrades de infraestrutura. Contínuo.

Buy - Riscos ocultos

Residência de dados: Onde os prompts são processados? Eles são usados para treinamento?

Vendor Lock-in: APIs proprietárias, formatos de embedding. Migração custa de 3 a 6 meses.

Disponibilidade: 12 horas de downtime por trimestre em média (Stanford HAI 2025).

A recomendação Hybrid

Para a maioria dos cenários enterprise, recomenda-se uma abordagem híbrida: Model Gateway como controle central (self-hosted), roteamento por sensibilidade, estratégia de fallback em caso de falha do provedor, otimização de custos por roteamento inteligente de modelos.

3 - EU AI Act e PL 2338/2023: 6 requisitos técnicos

O que juristas interpretam como obrigações de compliance são, para o CTO, requisitos de infraestrutura.

A partir de agosto de 2026, seis requisitos obrigatórios entram em vigor no EU AI Act (sujeito ao Digital Omnibus Package - possível adiamento para dezembro de 2027). No Brasil, o PL 2338/2023 estabelece obrigações semelhantes de transparência, supervisão humana e gestão de riscos para sistemas de IA de alto risco:

RequisitoArt.Medida de infraestrutura
Gestão de riscos9Confidence Routing, Circuit Breaker, Canary Deployments
Governança de dados10Data Lineage, Immutable Storage, Data Catalog
Obrigações de registro12Structured Logging, Retenção 10+ anos, Tamper-Proof
Transparência13Observability Stack, Decision Explanation API, Model Cards
Supervisão humana14HITL Gateway (arquitetônico), Kill Switch < 1s, Portal de Auditoria
Precisão/Robustez15Benchmark Pipeline, Adversarial Testing, Redundância multi-região

Gestão de riscos (Art. 9) - técnico

Confidence Routing: Cada saída de agente recebe um valor de confiança. Abaixo do limite: escalação. Circuit Breaker: Desativação automática em caso de anomalias. Canary Deployments: Novas versões de modelo implantadas gradualmente, rollback automático em caso de degradação.

Obrigações de registro (Art. 12) - técnico

Structured Logging: Cada chamada de API, cada decisão de agente, cada intervenção HITL. Retenção: Vida útil do sistema + 10 anos (Art. 19). Tamper-Proof: Logs append-only em armazenamento imutável.

Supervisão humana (Art. 14) - técnico

HITL Gateway: Aprovação humana forçada arquitetonicamente. Sem bypass. Kill Switch: Desativação imediata, latência < 1 segundo. Portal de Auditoria: Dashboard somente leitura para auditores de compliance.

Checklist de Compliance

Sanções (EU AI Act): Até 15 milhões de EUR ou 3% do faturamento anual global. PL 2338/2023 (Brasil): Sanções administrativas proporcionais, incluindo multas e suspensão do sistema.

4 - Security & Data Sovereignty

40% dos incidentes de segurança em ambientes de nuvem são causados por configuração incorreta - não por ataques (ENISA 2024).

4 pilares da Data Sovereignty

PilarRequisitoImplementação
Residência de DadosTodo processamento em data centers nacionais ou da UEModelos self-hosted ou região local/UE no provedor
CriptografiaEm repouso, em trânsito, em usoAES-256, TLS 1.3, mTLS, Confidential Computing
Zero TrustNenhuma confiança implícitaIdentity-Based Access, Least Privilege, Micro-Segmentation
Supply ChainOrigem de modelo e software verificadaModel Provenance, SBOM, Container Scanning, Signed Artifacts

Residência de dados em detalhe

ComponenteRequisito de residênciaImplementação
LLM InferencePrompts não podem sair do territórioSelf-hosted ou região local/UE no provedor
Vector DatabaseEmbeddings contêm conhecimento codificadoRegião local/UE ou self-hosted
LoggingLogs contêm dados pessoais (PII)Armazenamento local/UE com política WORM
BackupsMesmas regras dos dados de produçãoRegião local/UE, criptografado

Conformidade com a LGPD no uso de LLMs

CenárioRiscoMedida
PII em promptsArt. 7 LGPD - Base legalRemoção de PII antes da chamada de API
Dados de clientes em RAGArt. 6 LGPD - FinalidadeControle de acesso no nível do documento
Logs com dados de usuáriosArt. 18 LGPD - Direito de eliminaçãoPseudonimização + política de retenção
Embeddings com PIIArt. 20 LGPD - Decisões automatizadasDocumentação de transparência

5 - 4 padrões de infraestrutura em produção

Padrão 1: Agent Orchestration

Frameworks de agentes são construídos para experimentos, não para produção. Agentes enterprise precisam de: permissões definidas, trilhas de auditoria, rollback, controle de custos.

ComponenteFunçãoTecnologia
OrchestratorWorkflow, roteamento de tarefas, paralelizaçãoTemporal, Prefect, Custom
Permission LayerPermissões de agentes para ferramentas/APIsOPA, Cedar
State ManagementContexto, memória, progresso de tarefasRedis, PostgreSQL
ObservabilityTraces, consumo de tokens, latênciaOpenTelemetry, Langfuse

Resultado: MTTR em falhas de agentes -70%. Custos de API descontrolados -40 a 60% (projetos Gosign).

Padrão 2: Document Intelligence

80% dos dados empresariais são não estruturados (IDC 2024). Um pipeline de Document Intelligence classifica, extrai e vetoriza documentos automaticamente.

EtapaFunçãoTecnologia
IngestãoLeitura de PDF, Word, digitalização, e-mailTika, Unstructured.io
OCRConversão de digitalizações em textoTesseract, PaddleOCR
ClassificaçãoReconhecimento do tipo de documentoFine-tuned Classifier
ExtraçãoExtração de dados estruturadosLLM + Schema Validation
EmbeddingVetorização de documentosSentence Transformers
ArmazenamentoVetores + metadadospgvector, Qdrant

Resultado: Precisão de classificação de 92 a 97%. Processamento manual reduzido em 60 a 80%.

Padrão 3: Model Gateway

Camada central entre aplicações e provedores de LLM. Roteamento, detecção de PII, Rate Limiting, Caching, Fallback, Logging.

Tipo de requisiçãoRoteamentoJustificativa
Contém PIIModelo self-hostedOs dados permanecem no território
Classificação padrãoModelo mais econômicoOtimização de custos
Análise complexaModelo mais potenteQualidade priorizada
Provedor A indisponívelProvedor BDisponibilidade

Resultado: Custos de LLM -30 a 50% por roteamento e caching. Compliance através de triagem centralizada de PII.

Padrão 4: Monitoramento & Observabilidade

Sistemas de IA falham silenciosamente. Um LLM com respostas ruins não gera erro.

CamadaO que é medidoFerramentas
InfraestruturaCPU, GPU, memória, redePrometheus, Grafana
AplicaçãoLatência, taxa de erros, throughputOpenTelemetry, Jaeger
ModeloConfiança, tokens, alucinaçãoLangfuse, WhyLabs
NegócioTaxa de zero-touch, escalaçãoDashboards personalizados
CustosCustos de API por equipe/projetoInfracost, Custom
ComplianceCompletude de auditoria, taxa de HITLCustom + SIEM

Resultado: Problemas de qualidade detectados 4x mais rápido. Duração de impacto de incidentes -65% (Gartner 2024).

6 - Infrastructure Readiness Assessment

10 perguntas para o CTO. Avalie cada uma com 0 (não), 1 (parcialmente) ou 2 (sim).

#Pergunta012
1Inventário completo de todos os sistemas e APIs de IA (incluindo Shadow AI).
2Arquitetura de referência aprovada para workloads de IA com padrões definidos.
3Todo processamento de dados de IA comprovadamente em data centers nacionais ou da UE.
4Model Gateway com triagem de PII e logging centralizado.
5Structured Logging para cada chamada de API e cada decisão de agente.
6Kill Switch para agentes individuais e sistema de IA completo (< 1s).
7Custos de GPU/API rastreados por equipe, projeto e caso de uso.
8Avaliação automática de benchmark e adversarial antes do deployment.
9Estratégia de backup e DR específica para infraestrutura de IA.
10Todos os 6 requisitos do EU AI Act (Art. 9-15) e PL 2338/2023 comprovadamente atendidos.
PontuaçãoAvaliaçãoRecomendação
16-20Pronto para produçãoOtimização e escalabilidade. Pronto para workloads regulados.
10-15Base existentePreencher lacunas: Logging, triagem de PII, Kill Switch.
5-9Necessidade de recuperaçãoArquitetura de referência, Model Gateway, inventariar Shadow AI.
0-4Ação necessáriaComeçar imediatamente. Inventário + arquitetura de referência.
Distribuição de investimento (recomendação vs. realidade)
ItemAtualRecomendação
Modelos & Compute70%35-40%
Plataforma de infraestrutura15%25-30%
Governança & Compliance5%15-20%
Observabilidade & Monitoramento5%10-15%
Segurança5%10-15%

7 - Próximos passos

O plano de 90 dias

MêsFocoResultado
1Inventário & ArquiteturaInventário de IA, arquitetura de referência, residência de dados verificada, baseline de custos
2Gateway & GovernançaModel Gateway ativo, Structured Logging, Kill Switch, Observability Stack
3Compliance & PilotoChecklist EU AI Act e PL 2338/2023, Benchmark Pipeline, Adversarial Testing, auditoria de compliance

Stack de infraestrutura recomendado

CamadaRecomendaçãoAlternativas
Model GatewayLiteLLM, PortkeyCustom (Go/Python)
Agent OrchestrationTemporal + CustomPrefect, Airflow
Vector Databasepgvector (PostgreSQL)Qdrant, Weaviate
ObservabilityOpenTelemetry + GrafanaDatadog, Langfuse
Policy EngineOPACedar, Casbin
Secret ManagementVaultAWS KMS, SOPS
Container RuntimeKubernetesNomad, ECS
CI/CDGitHub ActionsGitLab CI, Tekton
Consultoria

Analisamos sua infraestrutura de IA e identificamos as lacunas críticas.

Compliance, segurança e governança de custos - 30 minutos, gratuito, sem compromisso.

Theandra Moreira - Diretora de Consultoria, Gosign GmbH

Contato: www.gosign.de/br/contato

Web: www.gosign.de