Tópico dedicado ao "Ultimate RAG Prompt" — estrutura e componentes de…
INEMA
Resumo sobre o “Ultimate RAG Prompt”
-
Introdução Existem três passos fundamentais para estar entre o 1% que domina o uso do RAG (Retrieval-Augmented Generation). Ele detalha dois prompts principais usados nesse processo: o RAG Prompt e o Query Rewriter Prompt.
-
Etapas principais de um sistema RAG
- Dados (Data): Primeiro, garantir que o conjunto de dados esteja limpo, puro e relevante.
- Prompt (Prompting): Depois, criar um prompt preciso e bem estruturado.
- Estrutura do prompt RAG O prompt deve conter cinco elementos essenciais: a) Papel (Role): Define o tipo de agente (ex.: especialista jurídico, professor, médico). b) Objetivo (Objective): Determina o que o agente deve fazer (extrair informações, explicar, resumir). c) Tipo de conhecimento (Knowledge):
- Local Strict: Usa apenas o conteúdo exato do banco de dados, sem inferências.
- Local Grounded: Usa o conteúdo do banco, mas com liberdade de interpretação.
- Global Augmented: Acrescenta contexto externo além da base. d) Citações (Citations): Como referenciar as fontes. e) Formato de saída (Output Structure): Define como a resposta será organizada.
- Query Rewriter Prompt
- Serve para melhorar a pergunta original feita ao sistema, tornando-a semanticamente mais rica.
- Exemplo: se alguém pergunta “Quantos anos tem Dexter?”, o rewriter reformula para incluir contexto relevante como “raça, idade média, nome completo, unidade de tempo” etc.
- Isso ajuda o sistema a encontrar respostas mais precisas ao consultar o banco de dados.
- Contexto e desambiguação
-
Ele discute se o agente deve conhecer o contexto do banco de dados.
-
Conclusão: geralmente não, para evitar viés; o agente deve lidar com dados puros.
- Mas o query rewriter pode receber um pequeno contexto de duas frases (chamado “disambiguation context”) para ajudar em casos ambíguos.
- Encerramento O criador menciona que está preparando um guia completo e aulas adicionais (capítulo 4) sobre como ganhar dinheiro com RAG e automações. Ele encerra desejando uma boa semana e convida os espectadores para a comunidade.
Exemplo prático final: Um escritório de advocacia usaria o Local Strict, com papel de especialista jurídico e objetivo de extração exata. Já um projeto educacional usaria Global Augmented, com papel de professor explicador e objetivo de contextualização.
Aqui está o resumo dos dois documentos que você enviou — o RAG Master Prompt e o RAG Query Rewriter Prompt — explicando como eles se conectam e como podem ser usados juntos para criar um sistema RAG completo.
1. RAG Master Prompt⌗
O Master Prompt é o núcleo do sistema RAG (Retrieval-Augmented Generation). Ele define como o agente principal deve se comportar e como estruturar as respostas com base nas informações recuperadas.
Componentes principais:
-
🦸 Papel (Role): Define o tipo de agente, podendo atuar como:
-
Especialista de domínio
- Analista de dados
- Resumidor de pesquisa
- Professor/Explicador
-
Consultor/Assessor
-
⛓ Cadeia (Chain Overview): Descreve o fluxo de execução do RAG:
- Envia a consulta original para o agente “Query Rewriter”.
- Recebe as versões reescritas da consulta.
- Usa essas variações para buscar documentos na base de conhecimento.
- Consolida e ranqueia os resultados.
- Gera a resposta final com base no conteúdo recuperado.
-
🎯 Objetivo (Objective): Define a profundidade e o tipo de resposta: a) Informação exata (local e factual) b) Explicação equilibrada com raciocínio contextual c) Resumo executivo com conclusões práticas d) Estilo didático para aprendizado
-
🧠 Conhecimento (Knowledge Mode): Controla o escopo da resposta: a) Local-Strict: apenas citações exatas das fontes. b) Local-Grounded: paráfrases baseadas apenas no conteúdo recuperado. c) Global-Augmented: permite adicionar conhecimento externo, desde que sinalizado.
-
🧐 Citações: Escolha se as respostas terão citações inline, apenas para citações diretas, ou nenhuma.
-
👨💻 Formato e Estrutura: O formato pode ser Markdown, parágrafos concisos, JSON ou texto simples. Três opções de estrutura:
-
Minimal (resposta rápida e factual)
- Standard (equilibrada e com contexto)
- Analytical (com análise profunda e recomendações).
2. RAG Query Rewriter Prompt⌗
O Query Rewriter é o agente auxiliar que melhora as consultas antes da recuperação de informações. Ele transforma perguntas vagas ou curtas em versões mais completas e semanticamente ricas, facilitando uma busca mais precisa.
Função: Receber a pergunta do usuário e gerar de 2 a 3 versões reformuladas que preservem a intenção, mas com melhor clareza e abrangência semântica.
Regras principais:
- Compreender a consulta original.
- Criar 2–3 variações claras e concisas (10–25 palavras).
- Manter a intenção idêntica.
- Evitar comentários, explicações ou formatações.
- Variar a redação, não o sentido.
- Expandir pronomes ou termos vagos quando necessário.
Domínio (Domain Context): Permite adicionar duas frases amplas de contexto sobre o banco de dados do RAG, apenas para casos de desambiguação.
3. Como os dois trabalham juntos⌗
- Fluxo ideal:
- O usuário faz uma pergunta.
- O Query Rewriter Agent reformula a pergunta para melhorar a busca.
- As consultas reformuladas são usadas para buscar trechos relevantes na base de dados.
- O RAG Master Agent recebe os resultados e produz a resposta final, seguindo o papel, objetivo e estrutura definidos.
4. Exemplo prático⌗
Pergunta do usuário: “O que é RAG e como ele melhora a precisão da IA?”
Etapa 1 – Query Rewriter gera:
- “Como o sistema RAG aumenta a precisão dos modelos de IA em recuperação de dados?”
- “Explique o papel do RAG na redução de erros em respostas geradas por IA.”
Etapa 2 – Master Prompt processa: Papel: Professor / Explicador Objetivo: Explicação equilibrada Conhecimento: Local-Grounded Formato: Markdown Resultado: Resposta clara, estruturada, com exemplos e evidências retiradas das fontes recuperadas.
O Prompt Definitivo de RAG
Existem três coisas de que você precisa para ter um excelente sistema RAG. Menos de 1% das pessoas usam todas as três. A PRIMEIRA é o prompt. Ninguém fala sobre isso.
Um prompt de RAG incrível tem cinco elementos:
- 🦸 Papel (Especialista / Analista / Resumidor / Explicador / Recomendador etc.)
- 🎯 Objetivo (extração exata / raciocínio contextual / RAG global)
- 🧠 Conhecimento (local estrito / local fundamentado / global)
- ✍️ Citações
- 🔥 Estrutura de Saída
Aqui um modelo de RAG simples, mas extremamente eficaz, que você pode usar diretamente. Edite-os aqui:
- Prompt RAG
- Prompt de Reescrita de Consulta
Basta escolher o que você quer para cada sistema RAG. Isso permite decidir se deseja que ele extraia APENAS o material de origem ou forneça contexto adicional, além de dezenas de outros fatores-chave. Também incluí o agente de reescrita de consulta.
Prompt Master de RAG
1