Tutorial sobre a Gemini File Search API — um RAG integrado lançado…
INEMA
Gemini File Search API – Como funciona e como implementar (Cloud Code + n8n)⌗
🆕 1. Contexto⌗
Poucos dias depois de o Aniden ter adicionado suporte a RAG + Web Search via OpenAI, o Google lançou em 6 de novembro a nova File Search API do Gemini, que é basicamente um RAG integrado, fácil de usar e muito mais barato.
Ela permite:
- enviar PDFs, JSON, arquivos de texto
- o Gemini converte automaticamente em embaralhamento vetorial (embeddings)
- cria um RAG pronto para uso
- permite você fazer perguntas com citações e trechos da fonte
💸 2. Custos e vantagens⌗
- Indexação custa apenas $0,15 por milhão de tokens
- Armazenamento e embeddings são grátis
- Muito mais barato que Pinecone Assistant (mínimo $50/mês + custos por hora)
🧪 3. Testando no Gemini AI Studio⌗
No AI Studio você pode:
- Abrir o demo do File Search
- Fazer upload de um PDF
- O sistema gera embeddings automaticamente
- Você pode fazer perguntas “o que este documento contém?”
- Ele responde rapidamente, com citações e trechos específicos
É literalmente um mini-RAG out-of-the-box.
🧵 4. Implementação no Cloud Code⌗
Exemplo:
- Criar uma interface onde você arrasta qualquer PDF
- O arquivo é enviado e processado pela API
- A API retorna o status “READY”
- O Cloud Code confirma que o RAG está criado
- Você pode consultar o documento diretamente
- Pode ativar opções como system prompt (ex: “sempre responder em tópicos”)
- E funciona imediatamente, com snippets e citações
🔧 5. Implementação no n8n (a parte mais difícil)⌗
Aqui está o fluxo explicado:
Desafios:⌗
- O File Search API exige que o binário do arquivo seja preservado durante todo o fluxo
- O n8n muitas vezes “perde” os dados binários entre nós HTTP
- Então criei códigos personalizados em JavaScript para manter o binário intacto
Etapas :⌗
- Upload do arquivo
- O n8n recebe PDF/arquivo como binário
- Código customizado
- Extrai o nome do arquivo, identificadores de binário etc.
- Cria a File Store do Gemini
- Nome personalizado da store
- API key adicionada manualmente
- Mantém o binário na memória
- Muito importante para não quebrar a operação
- Upload para o File Store via API
- Recebe um file_id
- Estado passa a ser ACTIVE
- Importa o arquivo para o store
- O documento passa a compor o RAG
- Consulta (search)
- Você faz uma query usando "search"
-
Ele retorna:
- texto
- citações
- grounded chunks (trechos específicos do documento)
🤖 6. Teste prático no n8n⌗
Perguntas como:
“Pode me dizer o que está neste documento?”
Fazem com que o n8n:
- invoque o tool “search”
- consulte o File Store
- retorne o resumo com trechos citados
O funcionamento provou ser muito competitivo com o Pinecone Assistant.
🏁 7. Conclusão⌗
O Gemini File Search:
- é muito barato
- rápido
- fácil de usar
- competitivo com serviços pagos de RAG
- tem citações automáticas
- funciona muito bem em n8n e Cloud Code
- permite criar SaaS que antes custavam $50–200/mês usando apenas API gratuita
Com o contexto de 1M tokens (que deve aumentar para 2–5M), vira uma ferramenta poderosa para qualquer solução baseada em documentos.
🔍 Por que o Gemini File Search API é um grande avanço⌗
1. Enorme vantagem de custo em relação ao Pinecone Assistant⌗
- Armazenamento gratuito + embeddings gerados gratuitamente no momento da consulta — isso já muda o jogo.
- Você só paga US$ 0,15 por milhão de tokens para a indexação inicial.
-
Comparado com o Pinecone Assistant:
-
Assinatura mínima de US$ 50 por mês
- Cobrança por hora por assistente
- Custos de tokens que crescem rápido
Para freelancers, equipes pequenas ou quem constrói protótipos, isso torna RAG praticamente gratuito.
⚙️ Como funciona por trás dos panos⌗
Você faz upload de:⌗
- Texto (TXT)
- JSON
- HTML (em breve deve chegar também)
O Gemini faz automaticamente:⌗
- Converte tudo para embeddings usando Gemma
- Armazena os embeddings sem custo
- Cria um índice pesquisável interno
-
Permite consultas em linguagem natural com:
-
Respostas contextualizadas
- Citações
- Trechos do documento original
Vantagem técnica importante:⌗
O Gemini já trabalha com contexto de 1 milhão de tokens, e provavelmente vai subir para 2–5 milhões — isso deixa o File Search ainda mais poderoso.
⚡ Desempenho⌗
Muita gente está relatando a mesma coisa que você observou:
- Respostas rápidas
- Citações precisas
- Extração de trechos confiável
- Qualidade comparável ao Pinecone Assistant
- Funciona bem tanto com Claude Code quanto com n8n
A parte complicada do manuseio de binários no n8n é real — bom que você já conseguiu resolver.
🧰 Casos de uso que isso destrava⌗
- Substituir serviços de RAG que custavam US$ 50–200/mês
- Criar RAG sem vector DB, sem Elasticsearch, sem nada
- Assistentes internos para empresas
- Agentes com memória baseada em documentos
- Automação no n8n lendo PDFs, relatórios, e-mails, exportações
- Organizar documentos pessoais ou profissionais
- Ferramentas para atendimento ao cliente com base em PDFs
Para quem desenvolve produtos indie, automações internas ou MVPs, o Gemini eliminou praticamente toda a complexidade operacional.
🔗 Links oficiais⌗
-
Anúncio oficial: https://blog.google/technology/developers/file-search-gemini-api/
-
Documentação completa: https://ai.google.dev/gemini-api/docs/file-search
m34 - Google File Search API - RAG
1