cerebro-vip INEMA.CLUB
inícioINEMA.N8N

Tutorial sobre a Gemini File Search API — um RAG integrado lançado…

INEMA.N8N · 2025-11-15 · ~4 min · ver no Telegram ↗

INEMA

Gemini File Search API – Como funciona e como implementar (Cloud Code + n8n)


🆕 1. Contexto

Poucos dias depois de o Aniden ter adicionado suporte a RAG + Web Search via OpenAI, o Google lançou em 6 de novembro a nova File Search API do Gemini, que é basicamente um RAG integrado, fácil de usar e muito mais barato.

Ela permite:

  • enviar PDFs, JSON, arquivos de texto
  • o Gemini converte automaticamente em embaralhamento vetorial (embeddings)
  • cria um RAG pronto para uso
  • permite você fazer perguntas com citações e trechos da fonte

💸 2. Custos e vantagens

  • Indexação custa apenas $0,15 por milhão de tokens
  • Armazenamento e embeddings são grátis
  • Muito mais barato que Pinecone Assistant (mínimo $50/mês + custos por hora)

🧪 3. Testando no Gemini AI Studio

No AI Studio você pode:

  1. Abrir o demo do File Search
  2. Fazer upload de um PDF
  3. O sistema gera embeddings automaticamente
  4. Você pode fazer perguntas “o que este documento contém?”
  5. Ele responde rapidamente, com citações e trechos específicos

É literalmente um mini-RAG out-of-the-box.


🧵 4. Implementação no Cloud Code

Exemplo:

  • Criar uma interface onde você arrasta qualquer PDF
  • O arquivo é enviado e processado pela API
  • A API retorna o status “READY”
  • O Cloud Code confirma que o RAG está criado
  • Você pode consultar o documento diretamente
  • Pode ativar opções como system prompt (ex: “sempre responder em tópicos”)
  • E funciona imediatamente, com snippets e citações

🔧 5. Implementação no n8n (a parte mais difícil)

Aqui está o fluxo explicado:

Desafios:

  • O File Search API exige que o binário do arquivo seja preservado durante todo o fluxo
  • O n8n muitas vezes “perde” os dados binários entre nós HTTP
  • Então criei códigos personalizados em JavaScript para manter o binário intacto

Etapas :

  1. Upload do arquivo
  • O n8n recebe PDF/arquivo como binário
  1. Código customizado
  • Extrai o nome do arquivo, identificadores de binário etc.
  1. Cria a File Store do Gemini
  • Nome personalizado da store
  • API key adicionada manualmente
  1. Mantém o binário na memória
  • Muito importante para não quebrar a operação
  1. Upload para o File Store via API
  • Recebe um file_id
  • Estado passa a ser ACTIVE
  1. Importa o arquivo para o store
  • O documento passa a compor o RAG
  1. Consulta (search)
  • Você faz uma query usando "search"
  • Ele retorna:

    • texto
    • citações
    • grounded chunks (trechos específicos do documento)

🤖 6. Teste prático no n8n

Perguntas como:

“Pode me dizer o que está neste documento?”

Fazem com que o n8n:

  • invoque o tool “search”
  • consulte o File Store
  • retorne o resumo com trechos citados

O funcionamento provou ser muito competitivo com o Pinecone Assistant.


🏁 7. Conclusão

O Gemini File Search:

  • é muito barato
  • rápido
  • fácil de usar
  • competitivo com serviços pagos de RAG
  • tem citações automáticas
  • funciona muito bem em n8n e Cloud Code
  • permite criar SaaS que antes custavam $50–200/mês usando apenas API gratuita

Com o contexto de 1M tokens (que deve aumentar para 2–5M), vira uma ferramenta poderosa para qualquer solução baseada em documentos.

🔍 Por que o Gemini File Search API é um grande avanço

1. Enorme vantagem de custo em relação ao Pinecone Assistant

  • Armazenamento gratuito + embeddings gerados gratuitamente no momento da consulta — isso já muda o jogo.
  • Você só paga US$ 0,15 por milhão de tokens para a indexação inicial.
  • Comparado com o Pinecone Assistant:

  • Assinatura mínima de US$ 50 por mês

  • Cobrança por hora por assistente
  • Custos de tokens que crescem rápido

Para freelancers, equipes pequenas ou quem constrói protótipos, isso torna RAG praticamente gratuito.


⚙️ Como funciona por trás dos panos

Você faz upload de:

  • PDF
  • Texto (TXT)
  • JSON
  • HTML (em breve deve chegar também)

O Gemini faz automaticamente:

  • Converte tudo para embeddings usando Gemma
  • Armazena os embeddings sem custo
  • Cria um índice pesquisável interno
  • Permite consultas em linguagem natural com:

  • Respostas contextualizadas

  • Citações
  • Trechos do documento original

Vantagem técnica importante:

O Gemini já trabalha com contexto de 1 milhão de tokens, e provavelmente vai subir para 2–5 milhões — isso deixa o File Search ainda mais poderoso.


⚡ Desempenho

Muita gente está relatando a mesma coisa que você observou:

  • Respostas rápidas
  • Citações precisas
  • Extração de trechos confiável
  • Qualidade comparável ao Pinecone Assistant
  • Funciona bem tanto com Claude Code quanto com n8n

A parte complicada do manuseio de binários no n8n é real — bom que você já conseguiu resolver.


🧰 Casos de uso que isso destrava

  • Substituir serviços de RAG que custavam US$ 50–200/mês
  • Criar RAG sem vector DB, sem Elasticsearch, sem nada
  • Assistentes internos para empresas
  • Agentes com memória baseada em documentos
  • Automação no n8n lendo PDFs, relatórios, e-mails, exportações
  • Organizar documentos pessoais ou profissionais
  • Ferramentas para atendimento ao cliente com base em PDFs

Para quem desenvolve produtos indie, automações internas ou MVPs, o Gemini eliminou praticamente toda a complexidade operacional.



m34 - Google File Search API - RAG

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗