Aula 6 do curso sobre RAG no n8n, cobrindo conceitos, comparação de…

INEMA

Aula 6

Como usar RAG no n8n passo a passo

Se preferir, você pode assistir ao vídeo no YouTube: AQUI

Introdução

Nesta aula, exploramos como implementar um sistema RAG (Geração Aumentada por Recuperação) no n8n utilizando o Pinecone como base vetorial. Explicamos a funcionalidade do RAG, as vantagens das bases vetoriais e a comparação entre Pinecone e Supabase. Finalmente, realizamos uma implementação prática no n8n para armazenar e recuperar informações a partir de uma base vetorial.

📊 1. Conceitos Chave

O que é RAG?

RAG é um modelo de IA que combina busca e geração de texto para melhorar a precisão das respostas. Baseia-se na extração de informações de documentos armazenados em uma base vetorial e na geração de respostas com base nesses dados.

Como funciona?
Carregamento de documentos em formatos como PDF, DOC, TXT, etc.
Conversão em embeddings utilizando o OpenAI.
Armazenamento em uma base vetorial como Pinecone ou Supabase.
Consulta e geração de respostas baseadas nas informações armazenadas.

🔬 2. Comparação entre Pinecone e Supabase

O Pinecone oferece integração direta com o n8n, é altamente escalável e está otimizado para buscas semânticas rápidas. Em contraste, o Supabase é mais versátil, permitindo armazenar diferentes tipos de dados, embora requeira configuração manual e seja menos rápido em buscas vetoriais.

Se o objetivo é velocidade e escalabilidade, o Pinecone é a melhor opção. Se há necessidade de armazenar diversos tipos de dados e maior flexibilidade, o Supabase é uma alternativa recomendável.

🚀 3. Implementação Prática no n8n

3.1 Carregamento de documentos na base vetorial

Baixar arquivo do Google Drive.
Processá-lo com o OpenAI para gerar embeddings.
Salvar embeddings no Pinecone.
Dividir o documento em fragmentos (chunks) de 1000 tokens com sobreposição de 100 tokens.
Armazenar os fragmentos na base vetorial.

3.2 Consulta da base vetorial com o n8n

Existem duas opções para consultar a base vetorial:

Módulo Question & Answer:
Mais simples e rápido.
Ideal para perguntas e respostas diretas.
Utiliza embeddings e um modelo LLM como o OpenAI 4.0 Mini.
Agente de IA:
Mais avançado e flexível.
Permite integrar ferramentas adicionais como Gmail ou Google Sheets.
Pode ser configurado com memória para lembrar perguntas anteriores.

Se desejamos apenas perguntas e respostas, usamos o módulo Question & Answer. Se precisamos realizar ações adicionais, usamos o Agente de IA.

https://www.youtube.com/watch?v=zNMoYA7eZ2s

ec6n8 - Curso RAG no N8N

Aula 6 do curso sobre RAG no n8n, cobrindo conceitos, comparação de…

Recursos