Aula prática (M24) sobre os novos nós Gemini no n8n, demonstrando…
INEMA
Dois workflows práticos utilizando os novos nós Gemini no n8n (após atualizar para a versão mais recente):
1. Workflow de Análise de Arquivos com Formulário⌗
Permite o upload de arquivos ou URLs, que são analisados automaticamente conforme o tipo (PDF, imagem, áudio ou vídeo).
-
Formulário com dois campos:
-
Upload de arquivo (exige o nome exato:
upload_file) - Inserção de URL
-
Usa um nó switch para detectar o tipo de arquivo:
-
Suporta
.pdf,.jpg,.png,.m4a,.mp4, etc. - Tipos ausentes (ex:
.wav) precisam ser adicionados manualmente -
Processadores específicos são acionados:
-
PDF → analisado com Gemini 2.5 Pro
- Áudio → transcrito com Gemini
- Imagem/Vídeo → analisados (imagem com bugs, vídeo sem retorno)
- Exemplo: Transcreveu com sucesso um áudio de 16MB gravado no carro
2. Chat com Geração de Imagens⌗
- Chat simples para comandos como “gerar imagem de um gato codando”
-
Tentativa de usar o nó Gemini para gerar imagem
-
Problemas de geobloqueio: a geração de imagem está restrita em alguns países, mesmo com VPN
Observações importantes:⌗
- O campo
upload_fileprecisa ser escrito corretamente (com_) - Alguns nós ainda são instáveis (erros 500 ou sem retorno)
- A estrutura de formulário ajuda a testar antes de integrar com serviços como Dropbox ou Google Drive
- A flexibilidade permite acionar agentes IA, gerar vídeos, transcrever, analisar documentos etc.
Conclusão:⌗
Esses novos nós transformam o n8n em uma central de análise e criação com IA, semelhante à OpenAI, e são ideais para fluxos robustos e personalizados. O vídeo fornece uma boa base para quem quer automatizar tarefas de mídia com IA, mesmo com as limitações atuais.
Novos Nós Gemini no n8n (Workflow Incluído)
Aqui está como usar os novos nós Gemini do n8n.
Veja o que agora é possível com esse fluxo fundamental (ah, atualize para a versão mais recente do n8n antes):
- → acessar os novos nós Gemini com funcionalidades no nível do OpenAI
- → analisar áudios, PDFs, imagens e vídeos
- → transcrever gravações
- → gerar imagens e vídeos
- → tudo via API, sem autenticação extra
Criei dois workflows:
- Um analisador universal de arquivos com upload via formulário
- Uma interface de chat
O analisador de arquivos usa um formulário que aceita upload de arquivos ou URLs. Em seguida, um nó do tipo switch detecta o tipo de arquivo (PDF, imagem, áudio, vídeo) e direciona para o processador Gemini apropriado.
Pegadinha importante: arquivos binários precisam ser chamados "upload_file" (com underline), e não "upload file" – isso me confundiu por um tempo.
Alguns nós ainda apresentam falhas:
- o analisador de imagens às vezes retorna erros 500
- o analisador de vídeo faz o upload, mas não retorna nada
- a geração de imagens está bloqueada geograficamente em alguns países
Por outro lado, a transcrição de áudio e a análise de PDFs funcionam perfeitamente – testei com um áudio de 16MB e um PDF de 25 páginas de um workshop.
M24 - Automação com Nodes Gemini
1