Aula 6 do curso sobre RAG no n8n, cobrindo conceitos, comparação de…
INEMA
Aula 6
Como usar RAG no n8n passo a passo
Se preferir, você pode assistir ao vídeo no YouTube: AQUI
Introdução
Nesta aula, exploramos como implementar um sistema RAG (Geração Aumentada por Recuperação) no n8n utilizando o Pinecone como base vetorial. Explicamos a funcionalidade do RAG, as vantagens das bases vetoriais e a comparação entre Pinecone e Supabase. Finalmente, realizamos uma implementação prática no n8n para armazenar e recuperar informações a partir de uma base vetorial.
📊 1. Conceitos Chave
- O que é RAG?
RAG é um modelo de IA que combina busca e geração de texto para melhorar a precisão das respostas. Baseia-se na extração de informações de documentos armazenados em uma base vetorial e na geração de respostas com base nesses dados.
-
Como funciona?
-
Carregamento de documentos em formatos como PDF, DOC, TXT, etc.
-
Conversão em embeddings utilizando o OpenAI.
-
Armazenamento em uma base vetorial como Pinecone ou Supabase.
-
Consulta e geração de respostas baseadas nas informações armazenadas.
🔬 2. Comparação entre Pinecone e Supabase
O Pinecone oferece integração direta com o n8n, é altamente escalável e está otimizado para buscas semânticas rápidas. Em contraste, o Supabase é mais versátil, permitindo armazenar diferentes tipos de dados, embora requeira configuração manual e seja menos rápido em buscas vetoriais.
Se o objetivo é velocidade e escalabilidade, o Pinecone é a melhor opção. Se há necessidade de armazenar diversos tipos de dados e maior flexibilidade, o Supabase é uma alternativa recomendável.
🚀 3. Implementação Prática no n8n
3.1 Carregamento de documentos na base vetorial
-
Baixar arquivo do Google Drive.
-
Processá-lo com o OpenAI para gerar embeddings.
-
Salvar embeddings no Pinecone.
-
Dividir o documento em fragmentos (chunks) de 1000 tokens com sobreposição de 100 tokens.
-
Armazenar os fragmentos na base vetorial.
3.2 Consulta da base vetorial com o n8n
Existem duas opções para consultar a base vetorial:
-
Módulo Question & Answer:
-
Mais simples e rápido.
-
Ideal para perguntas e respostas diretas.
-
Utiliza embeddings e um modelo LLM como o OpenAI 4.0 Mini.
-
Agente de IA:
-
Mais avançado e flexível.
-
Permite integrar ferramentas adicionais como Gmail ou Google Sheets.
-
Pode ser configurado com memória para lembrar perguntas anteriores.
Se desejamos apenas perguntas e respostas, usamos o módulo Question & Answer. Se precisamos realizar ações adicionais, usamos o Agente de IA.
https://www.youtube.com/watch?v=zNMoYA7eZ2s
ec6n8 - Curso RAG no N8N
1