O que é RAG (Retrieval Augmented Generation)?

RAG é um método que permite a um modelo de IA responder perguntas com base nos documentos da sua empresa, sem ser treinado com esses dados. Os documentos são indexados e seções relevantes são fornecidas ao modelo a cada consulta.

Quando usar RAG e quando Fine-Tuning?

RAG para 90% dos casos de uso empresariais: grandes bases de conhecimento, documentos atualizados frequentemente. Fine-Tuning apenas quando o modelo precisa aprender uma linguagem de domínio completamente nova ou um formato de resposta muito específico é necessário.

Como funciona a anonimização PII com IA?

Dados pessoais são automaticamente pseudonimizados antes de serem enviados ao modelo de IA. O modelo nunca vê nomes reais, salários ou outros dados sensíveis. Na resposta, os marcadores são substituídos pelos dados originais.

A LGPD impõe requisitos adicionais para RAG?

Sim. A LGPD (PT: RGPD) exige base legal para tratamento de dados pessoais, transparência e direitos do titular. A camada de pseudonimização garante que o modelo de IA nunca processe dados pessoais em texto aberto, atendendo aos requisitos de ambas as legislações.

RAG e Document Intelligence: Como a IA entende seus documentos

A pergunta central: A IA pode entender nossos próprios documentos?

“Podemos fazer a IA responder com base nos nossos documentos?” Essa pergunta surge em praticamente todas as empresas. A resposta é sim, com RAG (Retrieval Augmented Generation). O princípio: seus documentos permanecem na sua infraestrutura. O modelo de linguagem não é treinado com seus dados. Em vez disso, seções relevantes dos documentos são fornecidas ao modelo como contexto a cada consulta. O modelo responde com base nessas seções, com citação de fontes.

Nenhum vazamento de dados para terceiros. Nenhum retreinamento. Nenhuma perda de controle. E ainda assim, respostas em linguagem natural baseadas diretamente no conhecimento da sua organização.

RAG é hoje a abordagem padrão para conectar modelos de linguagem com conhecimento específico da organização. Este artigo explica como RAG funciona, quando é a escolha certa e por que Document Intelligence vai muito além de uma busca melhor, incluindo anonimização PII, redação de contratos e detecção de assinaturas.

Como RAG funciona

RAG consiste em duas fases: a indexação dos seus documentos e a resposta a consultas. O fluxo pode ser ilustrado em um diagrama:

Documentos → Chunking → Embedding → Banco de dados vetorial
                                         │
Consulta do usuário → Query Embedding → Busca por similaridade
                                         │
                              Seções relevantes + Consulta → LLM → Resposta com citação de fonte

Fase 1: Indexação. Seus documentos — PDFs, arquivos Word, páginas HTML, documentos escaneados — são divididos em seções significativas (chunking). Cada seção é convertida por um modelo de embedding em um vetor matemático. Esses vetores são armazenados em um banco de dados vetorial. O vetor representa o significado da seção, não sua redação literal. “Política de trabalho remoto” e “Acordo de home office” ficam próximos no espaço vetorial, mesmo usando palavras diferentes.

Fase 2: Consulta. Quando um usuário faz uma pergunta, ela também é convertida em um vetor. O banco de dados vetorial encontra as seções semanticamente mais próximas da pergunta, não por busca de palavras-chave, mas por cálculo de similaridade. Essas seções relevantes são enviadas ao modelo de linguagem junto com a pergunta original. O modelo gera uma resposta com base nessas fontes concretas.

O resultado: uma resposta em linguagem natural fundamentada nos seus documentos, com referências às passagens de onde a informação foi extraída.

A qualidade da indexação é decisiva. Chunks muito grandes diluem a relevância. Chunks muito pequenos perdem o contexto. A estratégia de chunking — tamanho, sobreposição, enriquecimento com metadados — determina em grande parte a qualidade das respostas. Um bom pipeline RAG não é a tecnologia em si, mas sua configuração para o cenário documental específico da sua empresa.

RAG vs. Fine-Tuning vs. Prompting

RAG não é a única forma de fornecer conhecimento de domínio a um modelo de linguagem. Existem três abordagens fundamentais, que diferem em esforço, custo e adequação:

Abordagem	O que acontece	Quando é adequado	Custo	Atualização
Prompting	Contexto fornecido diretamente no prompt	Volumes de dados pequenos	Baixo	Imediata
RAG	Documentos relevantes encontrados automaticamente	Grandes bases de conhecimento	Médio	Re-indexação
Fine-Tuning	Modelo retreinado	Linguagem especializada/domínio	Alto	Apenas via retreinamento

Prompting funciona quando o contexto relevante cabe na janela de contexto do modelo, tipicamente algumas dezenas de páginas. Para um único acordo coletivo (PT: acordo de empresa), isso é suficiente. Para uma base de conhecimento com centenas de documentos, não.

RAG escala para grandes acervos documentais. O banco de dados vetorial pode conter centenas de milhares de seções. A cada consulta, apenas as seções relevantes são recuperadas e enviadas ao modelo. Documentos podem ser atualizados a qualquer momento; basta uma re-indexação. O modelo não precisa ser retreinado.

Fine-Tuning altera os pesos do próprio modelo. É apropriado quando o modelo precisa aprender uma linguagem de domínio completamente nova — por exemplo, terminologia médica ou uma nomenclatura proprietária — ou quando um formato de resposta muito específico é necessário. Fine-Tuning é custoso, trabalhoso e exige retreinamento a cada atualização.

Para 90% dos casos de uso empresariais, RAG é a abordagem certa. A combinação de grandes bases de conhecimento, atualizações frequentes e a necessidade de citações de fontes torna RAG o padrão para conhecimento corporativo.

Document Intelligence: mais do que busca

RAG responde perguntas com base em documentos. Document Intelligence vai além: abrange todos os métodos pelos quais a IA não apenas lê documentos, mas os entende, classifica e processa, incluindo a proteção de informações sensíveis.

As três áreas de aplicação mais importantes no contexto empresarial: anonimização PII, redação de contratos e detecção de assinaturas.

Anonimização PII: pseudonimização com ciclo completo

Dados pessoais (PII, Personally Identifiable Information) não podem ser enviados a um modelo de linguagem em muitos casos de uso. Salários, nomes reais, números de matrícula, dados de saúde. A LGPD (PT: RGPD) e políticas internas de proteção de dados estabelecem limites claros.

A solução é a pseudonimização com ciclo completo (roundtrip). Um exemplo concreto:

Documento original: “João Silva, Departamento Financeiro, salário R$ 12.000, adere ao acordo coletivo de horário flexível.”

Após pseudonimização (entrada para o modelo): “Pessoa_A, Departamento_X, Salário_Y, adere ao acordo coletivo de horário flexível.”

O modelo de linguagem processa a consulta com dados pseudonimizados. Em nenhum momento vê o nome real, o departamento ou o salário.

Após re-identificação (saída para o usuário): Os marcadores no resultado são substituídos pelos dados originais. O usuário vê a resposta completa. O modelo nunca a viu.

Esse ciclo acontece automaticamente. Para o usuário, o processo é transparente. Para o modelo, os dados são inacessíveis em todos os momentos. Para a infraestrutura isso significa: a camada de pseudonimização fica entre o usuário e o modelo e é aplicada tecnicamente, não opcionalmente.

A anonimização PII é especialmente relevante para aplicações de RH, onde prontuários de funcionários, folhas de pagamento ou avaliações de desempenho devem ser processados com auxílio de IA. Sem anonimização, esses casos de uso não estão em conformidade com a LGPD no Brasil (PT: RGPD na UE).

Redação de contratos (Redaction)

A redação de contratos vai além da pseudonimização. Enquanto a pseudonimização substitui dados e os restaura ao final, a redação remove fisicamente o conteúdo do documento, de forma irrevogável para o destinatário em questão.

O caso de uso: diferentes departamentos precisam de visões diferentes do mesmo contrato. O departamento jurídico vê o contrato completo. Compras vê uma versão sem cláusulas de responsabilidade. A diretoria vê um resumo sem detalhes operacionais.

A redação funciona com base em regras. Para cada categoria de documento e cada grupo de destinatários, define-se quais seções são visíveis e quais são redigidas. As regras são configuradas e versionadas no Decision Layer, não aplicadas manualmente.

O resultado: cada função vê exatamente a informação que é relevante e autorizada para ela. Nenhuma redação manual. Nenhuma passagem esquecida. Nenhuma versão encaminhada acidentalmente na íntegra.

Detecção de assinaturas

Arquivos de contratos em empresas frequentemente contêm milhares de documentos. A pergunta sobre se um contrato específico está completamente assinado exige hoje, muitas vezes, revisão manual página por página. Com centenas de contratos, isso é inviável.

Document Intelligence resolve esse problema por meio da detecção automatizada de assinaturas. O sistema verifica contratos escaneados quanto à presença de assinaturas nos locais designados. Assinaturas ausentes são sinalizadas automaticamente. O resultado: uma visão geral de todos os contratos no arquivo que ainda não foram completamente assinados, em minutos em vez de semanas.

O caso de uso vai além da mera detecção. Em combinação com um pipeline RAG, o sistema também pode responder perguntas como: “Quais contratos-quadro com prazo superior a 3 anos foram renovados no último trimestre sem assinatura da diretoria?”

Exemplo prático: O assistente de acordos coletivos

Um cenário concreto da prática de RH. Um departamento de pessoal de uma empresa de médio porte gerencia mais de 100 acordos coletivos ativos (PT: acordos de empresa): jornada de trabalho, trabalho remoto, viagens a serviço, treinamento, previdência complementar, gestão de reintegração, proteção de dados, uso de TI e muito mais. Cada acordo tem aditivos, anexos e referências cruzadas a outros acordos.

Quando um analista de RH precisa responder à pergunta: “Qual é a regra de trabalho remoto para funcionários em regime parcial na produção?”, hoje isso significa: encontrar o acordo coletivo correto, localizar a passagem relevante, verificar se existe um aditivo, comparar com a convenção coletiva (PT: contrato coletivo de trabalho), considerar regras específicas da unidade. Resultado: 30 a 45 minutos de pesquisa. Em caso de dúvida, consulta ao departamento jurídico. Mais alguns dias de espera.

Com um assistente de acordos coletivos baseado em RAG: todos os acordos são indexados, incluindo aditivos, anexos e referências cruzadas. O analista de RH faz a pergunta em linguagem natural. O sistema encontra as passagens relevantes dos documentos corretos, considera o aditivo de março de 2025, referencia a regra especial para funcionários da produção e entrega a resposta em 10 segundos. Com citação de fonte. Com versão da norma.

Isso não é um cenário teórico. É o caso de uso padrão com o qual empresas implementam seu primeiro pipeline RAG. O esforço é gerenciável: fornecer documentos, configurar a estratégia de chunking, definir direitos de acesso, testar. A infraestrutura — banco de dados vetorial, modelo de embedding, modelo de linguagem, pipeline de recuperação — é construída uma vez e fica disponível para casos de uso adicionais.

Garantia de qualidade: Por que resultados RAG são tão bons quanto a indexação

RAG não funciona sozinho. As fontes de erro mais comuns na prática:

Estratégia de chunking ruim. Chunks muito grandes (capítulos inteiros) fornecem contexto irrelevante demais. Chunks muito pequenos (parágrafos individuais) perdem a coerência. O tamanho de chunk adequado depende do tipo de documento: uma especificação técnica exige chunks diferentes de um acordo coletivo.

Metadados ausentes. Sem metadados (tipo de documento, data de vigência, versão, escopo), o pipeline de recuperação não consegue distinguir entre uma norma vigente e uma obsoleta. O enriquecimento de metadados durante a indexação não é opcional, é essencial.

Sem controle de acesso. Em um ambiente corporativo, nem todo usuário deve acessar todos os documentos. O pipeline RAG deve refletir a estrutura de permissões existente: documentos de RH apenas para RH, dados financeiros apenas para Finanças, comunicações da diretoria apenas para pessoas autorizadas.

Sem verificação de fontes. RAG fornece citações de fontes. Mas elas estão corretas? Uma garantia de qualidade — verificação por amostragem das referências, mecanismo de feedback para usuários, avaliação regular — é necessária para detectar alucinações e aprimorar o pipeline.

Essa garantia de qualidade é parte da operação contínua, não de uma configuração inicial única. Documentos mudam. Novos são adicionados. Antigos perdem a validade. O pipeline RAG deve evoluir, por meio de re-indexação regular, atualização de metadados e feedback dos usuários.

Integração no portal Enterprise AI

RAG não é um sistema isolado. Em uma arquitetura bem projetada, o pipeline RAG está integrado ao portal Enterprise AI. Funcionários fazem perguntas por meio de uma interface unificada, a mesma pela qual interagem com agentes de IA.

O portal gerencia os direitos de acesso: quem pode consultar qual base de conhecimento? Funcionários de RH veem o assistente de acordos coletivos. O departamento jurídico vê o assistente de contratos. Compras vê o assistente de diretrizes de fornecedores. Cada usuário vê apenas aquilo para o qual está autorizado.

A combinação de RAG e agentes de IA abre possibilidades ampliadas: um agente pode não apenas responder uma pergunta, mas, com base nos resultados RAG, disparar uma ação — por exemplo, gerar um alerta de prazo quando um contrato está prestes a vencer, ou criar uma lista de verificação quando um novo acordo coletivo entra em vigor.

Enterprise AI-Infrastruktur Blueprint 2026 — Serie de artigos

← Anterior	Visão geral	Próximo →
Portal Enterprise AI: Quatro interfaces Open Source em comparação	Visão geral	De chatbots a agentes IA: MCP, A2A e sistemas Multi-Agent

Todos os artigos desta série: Enterprise AI-Infrastruktur Blueprint 2026

Quer tornar o conhecimento da sua empresa acessível para IA? Gosign constrói pipelines RAG e soluções de Document Intelligence para clientes corporativos — agnóstico em relação a modelos, com anonimização PII e controle de acesso completo.

Agende uma consulta. 30 minutos para determinar quais documentos devem se tornar acessíveis para IA primeiro.