cerebro-vip INEMA.CLUB
inícioINEMA.PROMPTS

Tópico dedicado ao "Ultimate RAG Prompt" — estrutura e componentes de…

INEMA.PROMPTS · 2025-10-06 · ~5 min · ver no Telegram ↗

INEMA

Resumo sobre o “Ultimate RAG Prompt”

  1. Introdução Existem três passos fundamentais para estar entre o 1% que domina o uso do RAG (Retrieval-Augmented Generation). Ele detalha dois prompts principais usados nesse processo: o RAG Prompt e o Query Rewriter Prompt.

  2. Etapas principais de um sistema RAG

  • Dados (Data): Primeiro, garantir que o conjunto de dados esteja limpo, puro e relevante.
  • Prompt (Prompting): Depois, criar um prompt preciso e bem estruturado.
  1. Estrutura do prompt RAG O prompt deve conter cinco elementos essenciais: a) Papel (Role): Define o tipo de agente (ex.: especialista jurídico, professor, médico). b) Objetivo (Objective): Determina o que o agente deve fazer (extrair informações, explicar, resumir). c) Tipo de conhecimento (Knowledge):
  • Local Strict: Usa apenas o conteúdo exato do banco de dados, sem inferências.
  • Local Grounded: Usa o conteúdo do banco, mas com liberdade de interpretação.
  • Global Augmented: Acrescenta contexto externo além da base. d) Citações (Citations): Como referenciar as fontes. e) Formato de saída (Output Structure): Define como a resposta será organizada.
  1. Query Rewriter Prompt
  • Serve para melhorar a pergunta original feita ao sistema, tornando-a semanticamente mais rica.
  • Exemplo: se alguém pergunta “Quantos anos tem Dexter?”, o rewriter reformula para incluir contexto relevante como “raça, idade média, nome completo, unidade de tempo” etc.
  • Isso ajuda o sistema a encontrar respostas mais precisas ao consultar o banco de dados.
  1. Contexto e desambiguação
  • Ele discute se o agente deve conhecer o contexto do banco de dados.

  • Conclusão: geralmente não, para evitar viés; o agente deve lidar com dados puros.

  • Mas o query rewriter pode receber um pequeno contexto de duas frases (chamado “disambiguation context”) para ajudar em casos ambíguos.
  1. Encerramento O criador menciona que está preparando um guia completo e aulas adicionais (capítulo 4) sobre como ganhar dinheiro com RAG e automações. Ele encerra desejando uma boa semana e convida os espectadores para a comunidade.

Exemplo prático final: Um escritório de advocacia usaria o Local Strict, com papel de especialista jurídico e objetivo de extração exata. Já um projeto educacional usaria Global Augmented, com papel de professor explicador e objetivo de contextualização.

Aqui está o resumo dos dois documentos que você enviou — o RAG Master Prompt e o RAG Query Rewriter Prompt — explicando como eles se conectam e como podem ser usados juntos para criar um sistema RAG completo.


1. RAG Master Prompt

O Master Prompt é o núcleo do sistema RAG (Retrieval-Augmented Generation). Ele define como o agente principal deve se comportar e como estruturar as respostas com base nas informações recuperadas.

Componentes principais:

  • 🦸 Papel (Role): Define o tipo de agente, podendo atuar como:

  • Especialista de domínio

  • Analista de dados
  • Resumidor de pesquisa
  • Professor/Explicador
  • Consultor/Assessor

  • ⛓ Cadeia (Chain Overview): Descreve o fluxo de execução do RAG:

  1. Envia a consulta original para o agente “Query Rewriter”.
  2. Recebe as versões reescritas da consulta.
  3. Usa essas variações para buscar documentos na base de conhecimento.
  4. Consolida e ranqueia os resultados.
  5. Gera a resposta final com base no conteúdo recuperado.
  • 🎯 Objetivo (Objective): Define a profundidade e o tipo de resposta: a) Informação exata (local e factual) b) Explicação equilibrada com raciocínio contextual c) Resumo executivo com conclusões práticas d) Estilo didático para aprendizado

  • 🧠 Conhecimento (Knowledge Mode): Controla o escopo da resposta: a) Local-Strict: apenas citações exatas das fontes. b) Local-Grounded: paráfrases baseadas apenas no conteúdo recuperado. c) Global-Augmented: permite adicionar conhecimento externo, desde que sinalizado.

  • 🧐 Citações: Escolha se as respostas terão citações inline, apenas para citações diretas, ou nenhuma.

  • 👨‍💻 Formato e Estrutura: O formato pode ser Markdown, parágrafos concisos, JSON ou texto simples. Três opções de estrutura:

  • Minimal (resposta rápida e factual)

  • Standard (equilibrada e com contexto)
  • Analytical (com análise profunda e recomendações).

2. RAG Query Rewriter Prompt

O Query Rewriter é o agente auxiliar que melhora as consultas antes da recuperação de informações. Ele transforma perguntas vagas ou curtas em versões mais completas e semanticamente ricas, facilitando uma busca mais precisa.

Função: Receber a pergunta do usuário e gerar de 2 a 3 versões reformuladas que preservem a intenção, mas com melhor clareza e abrangência semântica.

Regras principais:

  1. Compreender a consulta original.
  2. Criar 2–3 variações claras e concisas (10–25 palavras).
  3. Manter a intenção idêntica.
  4. Evitar comentários, explicações ou formatações.
  5. Variar a redação, não o sentido.
  6. Expandir pronomes ou termos vagos quando necessário.

Domínio (Domain Context): Permite adicionar duas frases amplas de contexto sobre o banco de dados do RAG, apenas para casos de desambiguação.


3. Como os dois trabalham juntos

  • Fluxo ideal:
  1. O usuário faz uma pergunta.
  2. O Query Rewriter Agent reformula a pergunta para melhorar a busca.
  3. As consultas reformuladas são usadas para buscar trechos relevantes na base de dados.
  4. O RAG Master Agent recebe os resultados e produz a resposta final, seguindo o papel, objetivo e estrutura definidos.

4. Exemplo prático

Pergunta do usuário: “O que é RAG e como ele melhora a precisão da IA?”

Etapa 1 – Query Rewriter gera:

  • “Como o sistema RAG aumenta a precisão dos modelos de IA em recuperação de dados?”
  • “Explique o papel do RAG na redução de erros em respostas geradas por IA.”

Etapa 2 – Master Prompt processa: Papel: Professor / Explicador Objetivo: Explicação equilibrada Conhecimento: Local-Grounded Formato: Markdown Resultado: Resposta clara, estruturada, com exemplos e evidências retiradas das fontes recuperadas.


O Prompt Definitivo de RAG

Existem três coisas de que você precisa para ter um excelente sistema RAG. Menos de 1% das pessoas usam todas as três. A PRIMEIRA é o prompt. Ninguém fala sobre isso.

Um prompt de RAG incrível tem cinco elementos:

  1. 🦸 Papel (Especialista / Analista / Resumidor / Explicador / Recomendador etc.)
  2. 🎯 Objetivo (extração exata / raciocínio contextual / RAG global)
  3. 🧠 Conhecimento (local estrito / local fundamentado / global)
  4. ✍️ Citações
  5. 🔥 Estrutura de Saída

Aqui um modelo de RAG simples, mas extremamente eficaz, que você pode usar diretamente. Edite-os aqui:

  1. Prompt RAG
  2. Prompt de Reescrita de Consulta

Basta escolher o que você quer para cada sistema RAG. Isso permite decidir se deseja que ele extraia APENAS o material de origem ou forneça contexto adicional, além de dezenas de outros fatores-chave. Também incluí o agente de reescrita de consulta.

Prompt Master de RAG

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗