Aula prática (e42) sobre automação N8N para geração de imagens e…
INEMA
Apêndice de Exemplos — só os trechos técnicos (YAML, JSON, curl, expressões n8n) para você usar como referência rápida.
Exemplo 1 – Prompt de Imagem (YAML simples, 16:9)⌗
image_prompt: mulher jovem sorridente segurando um buquê em frente à floricultura
style: realista, iluminação suave, lente 50mm
composition: plano médio, foco no rosto e no produto
aspect_ratio: 16:9
negatives: mãos extras, distorções faciais, texto ilegível, logotipos reais
Exemplo 2 – Prompt de Vídeo (YAML multi-cena)⌗
total_duration: 30
scene_length: 8
num_scenes: 4
aspect_ratio: 16:9
scenes:
- id: 1
prompt: a modelo apresenta a loja em plano médio
dialogue: "Oi pessoal… nossa floricultura vai abrir na próxima semana!"
- id: 2
prompt: close no buquê de flores em mãos
dialogue: "Olha só que flores incríveis… tudo fresquinho."
- id: 3
prompt: plano geral da fachada da loja
dialogue: "Estamos preparando um espaço muito especial…"
- id: 4
prompt: a modelo sorri e acena na frente da loja
dialogue: "Venha nos visitar e ganhe um presente exclusivo!"
Exemplo 3 – cURL Nano Banana (criar imagem)⌗
curl -X POST https://api.kie.ai/v1/images/create \
-H "Authorization: Bearer SUA_KIE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model":"nano-banana-edit",
"prompt":"mulher sorridente segurando buquê em floricultura, realista, 16:9",
"aspect_ratio":"16:9",
"image_urls":["https://api.telegram.org/file/botSEU_TOKEN/FILE_PATH"],
"callback_url":"{{$execution.resumeUrl}}"
}'
Exemplo 4 – cURL Veo3 Fast (gerar cena de vídeo)⌗
curl -X POST https://api.kie.ai/v1/videos/create \
-H "Authorization: Bearer SUA_KIE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model":"veo3-fast",
"prompt":"a modelo apresenta a floricultura sorrindo",
"dialogue":"Nossa loja abre semana que vem… estamos te esperando!",
"aspect_ratio":"16:9",
"reference_image_urls":["https://meu-servidor.com/imagem_aprovada.jpg"]
}'
Exemplo 5 – cURL Fal.ai (merge vídeos)⌗
curl -X POST https://api.fal.ai/v1/merge_videos \
-H "Authorization: Bearer SUA_FAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"video_urls":["https://cdn.kie.ai/cena1.mp4","https://cdn.kie.ai/cena2.mp4"],
"transitions":"none"
}'
Exemplo 6 – Expressão n8n (pegar última foto do Telegram)⌗
{{$json["photo"][$json["photo"].length - 1].file_id}}
Exemplo 7 – Expressão n8n (parsear JSON de resposta)⌗
{{ JSON.parse($json.data).image_url }}
✅ Com esse apêndice, você tem:
- Modelos prontos de prompts (imagem + vídeo).
- Comandos cURL reais para testar fora do n8n.
- Expressões típicas do n8n para lidar com Telegram e respostas de API.
**Hacks – ** (diretos, sem enrolar, só truques aplicáveis para turbinar o fluxo):
Hacks de Consistência⌗
- Mais de uma imagem de referência → passe 2–3 ângulos do rosto/produto para o Nano Banana → avatar fica idêntico em todas as variações.
- Travar aspecto 16:9 em todos os pontos → inclua
aspect_ratio: 16:9tanto no prompt quanto no body da API → evita cortes. - Usar “negatives” sempre → bloqueie distorções típicas: mãos extras, olhos tortos, texto ilegível.
- Roupa-âncora → sempre inclua uma peça fixa (ex.: jaqueta vermelha) → reforça consistência entre cenas.
Hacks de Prompt⌗
- YAML/JSON curto → menos campos = menos erro. Foco só em:
image_prompt, style, aspect_ratio, negatives. - Diálogo UGC natural → 25–30 palavras, tom de conversa com amigo, nunca tom de anúncio.
- Cena = objetivo único → cada cena mostra só 1 coisa: (apresentar, detalhe, call-to-action leve).
Hacks de Telegram⌗
- Sempre pegar última foto do array → é a de maior qualidade.
- Teclado inline para respostas → botões [Aprovar] [Gerar outra] → fluxo mais rápido e barato.
- Feedback guiado → se “Gerar outra”, peça campos fixos: “Trocar fundo / Ajustar luz / Mudar roupa” → menos tentativa e erro.
Hacks de Automação (n8n)⌗
- Use
execution.resumeUrl→ evite loops de checagem, mais barato e rápido. - Salvar task_id e urls em planilha → facilita reuso, auditoria e suporte.
- Retry exponencial simples → 5s → 15s → 30s → evita falhas de rede sem gastar muito.
Hacks de Custo e Escala⌗
- Gate obrigatório → só gerar vídeo após aprovação da imagem → corta 70% de gasto desnecessário.
- Cache de avatar → se o mesmo usuário pedir de novo, reuse referência aprovada → custo quase zero para repetir rosto.
- Fila simples → limite 2–3 jobs por vez → evita rate-limit e travamentos.
Hacks de Qualidade Extra⌗
- Feedback textual no loop → se imagem não agradar, deixe o usuário digitar ajuste → IA melhora na próxima rodada.
- Evitar “tom vendedor” no vídeo → diálogo mais realista aumenta retenção (o público não pula).
- Close-ups intercalados → peça 1 cena de close no produto → aumenta impacto sem perder consistência.
- Juntar áudio depois → se usar TTS, processe separado e sincronize → voz mais limpa.
Passo 5 (Finalização e Entrega) de forma direta e prática:
Passo 5 — Finalização e Entrega⌗
- Unir todas as cenas em um só vídeo
- Use um nó HTTP Request (POST) para o Fal.ai.
-
Body:
{ "video_urls": ["{{urlCena1}}","{{urlCena2}}","{{urlCena3}}","{{urlCena4}}"], "transitions": "none" }* Resposta:request_idpara acompanhar o processamento.
- Esperar o merge terminar
- Use Wait (tempo fixo \~30s) ou loop de checagem no endpoint
get_resultdo Fal.ai. - Condição:
status = completed. - Saída:
final_video_url(link do vídeo final em 16:9).
- Enviar vídeo final pelo Telegram
- Use Telegram → SendVideo.
- Input:
chat_iddo usuário +final_video_url. - Mensagem de acompanhamento: “Aqui está seu vídeo final! 🎬”
- (Opcional) Salvar log do job
- Em planilha ou DB (Supabase, Airtable, Google Sheets).
- Campos úteis: chat_id, legenda original, prompt usado, urls das cenas, url final, data/hora, custo estimado.
✅ Resultado esperado do Passo 5: O usuário recebe no Telegram um vídeo único em 16:9, com múltiplas cenas unidas, consistência visual mantida e pronto para uso em redes sociais.
Passo 4 (Criação do Vídeo) de forma direta e prática:
Passo 4 — Criação do Vídeo⌗
- Gerar roteiro multi-cena estilo UGC
- Use um nó OpenAI Chat (gpt-4.1).
-
Entrada:
- Texto da legenda do usuário.
- Análise da imagem aprovada.
- URL da imagem final aprovada.
- Peça uma saída estruturada:
total_duration: 30 # duração total em segundos scene_length: 8 # duração de cada cena (~8s) num_scenes: 4 # calculado = ceil(total/scene_length) aspect_ratio: 16:9 scenes: - id: 1 prompt: descrição da cena dialogue: fala curta e natural, até 30 palavras - id: 2 prompt: ... dialogue: ...
- Separar cenas para loop
- Use Split In Batches ou Item Lists no n8n.
- Cada item = 1 cena com
prompt+dialogue.
- Gerar cada cena com Veo3 Fast
- Para cada cena, use um nó HTTP Request (POST) no KIE.ai.
-
Body mínimo:
{ "model": "veo3-fast", "prompt": "{{prompt_da_cena}}", "dialogue": "{{dialogue_da_cena}}", "aspect_ratio": "16:9", "reference_image_urls": ["{{URL_IMAGEM_APROVADA}}"] }* Resultado:task_idde cada vídeo.
- Esperar vídeos ficarem prontos
- Use um Wait (tempo fixo, ex. 60s) ou um loop de checagem com o endpoint
record/infodo KIE.ai. - Condição de saída:
status = success. - Guarde todas as
video_urlsem uma lista.
✅ Resultado esperado do Passo 4: Você terá uma lista de clipes de 8–10s cada, em 16:9, todos com o mesmo avatar e estilo visual.
Passo 3 (Validação da Imagem) de forma direta e prática:
Passo 3 — Validação da Imagem⌗
- Gerar a imagem com Nano Banana
- Use um nó HTTP Request (POST) para o KIE.ai.
- Modelo:
nano-banana-edit. -
Body mínimo:
{ "model": "nano-banana-edit", "prompt": "{{prompt_estruturado}}", "aspect_ratio": "16:9", "image_urls": ["{{URL_IMAGEM_TELEGRAM}}"], "callback_url": "{{$execution.resumeUrl}}" }* Ocallback_urlfaz com que o KIE.ai avise o n8n quando terminar (sem precisar de loop de checagem).
- Esperar o retorno
- Adicione um nó Wait configurado em modo On Webhook Call.
- Assim que o KIE.ai terminar, o fluxo continua automaticamente.
- Pegar a imagem final
- Use um nó HTTP Request (GET) para o endpoint
record/infodo KIE.ai. - Passe o
task_idda criação. - Extraia a URL da imagem gerada.
- Enviar a imagem ao usuário para validação
- Use um nó Telegram SendPhoto.
- Envie a imagem gerada + uma mensagem tipo: “Aqui está a imagem gerada. Deseja aprovar ou gerar outra?”
- Receber resposta do usuário
- Use Telegram → Send and wait for response.
- Configure botões: [Aprovar] | [Gerar outra].
- Tratar a resposta
- Se [Aprovar] → segue para o próximo passo (roteiro do vídeo).
-
Se [Gerar outra] → volte ao Passo 2 (criar novo prompt).
- Opcional: permita que o usuário escreva o que quer mudar (ex.: “trocar fundo” ou “mais iluminação”) e inclua esse feedback no próximo prompt.
✅ Resultado esperado do Passo 3: O usuário aprova uma imagem 16:9 consistente, que servirá como base para o vídeo.
Passo 2 (Preparação da imagem) detalhado de forma direta e prática:
Passo 2 — Preparação da Imagem⌗
- Pegar a melhor versão da foto
- No output do Telegram Trigger, a foto vem em um array
photo[]. - Sempre use a última posição (maior resolução).
-
Expressão no n8n:
{{$json["photo"][$json["photo"].length - 1].file_id}}
-
Gerar a URL direta da imagem ** * Use um nó HTTP Request (Telegram getFile).** * Endpoint:
`` * A resposta traz file_path.
` * Monte a URL final:
``` https://api.telegram.org/file/bot{{BOT_TOKEN}}/{{file_path}}
```3. Ana**lisar a imagem com IA
** * Use um nó Ope**nAI Chat (gpt-4.1). ** * Entrada: URL da imagem. * Peça saída estruturada simples:
* pessoa
* roupa
* expressão
* cenário
* paleta de cores
* iluminação
Exemplo de instrução:
```Analise a imagem enviada.
Retorne JSON com: pessoa, roupa, expressão, cenário, paleta_cores, iluminação.
4```. Criar prompt de imagem 16:9
** * Use outro Open**AI Chat (gpt-4.1). * Combine:
* caption do usuário (texto que ele mandou)
* análise da imagem (resultado do passo anterior)
- Saída final (em YAML ou JSON):
``` image_prompt: descrição objetiva da cenastyle: realista, iluminação suave, foco no rosto/produto
composition: plano médio, enquadramento central
aspect_ratio: 16:9
negatives: mãos extras, distorção de rosto, logos reais
--```-
✅ Resultado esperado do Passo 2: Você terá a URL direta da foto do Telegram + um prompt estruturado 16:9 pronto para enviar ao modelo Nano Banana.
o Passo 1 (Entrada do usuário) de forma direta, prática e útil para alguém configurar no n8n:
Passo 1 — Entrada do usuário (Telegram)⌗
- Criar o bot no Telegram
- Abra o Telegram e fale com o @BotFather.
- Use o comando
/newbot, escolha nome e @username. - Copie o token do bot que ele entregar (ex.:
123456:ABC-DEF...).
- Configurar o nó Telegram Trigger no n8n
- Adicione um Telegram Trigger Node.
- Nas credenciais, cole o token do bot criado.
- Configure para ouvir mensagens.
- Ative receber foto + legenda (caption).
- Testar o gatilho
- No Telegram, envie uma foto com uma mensagem de texto na legenda para o bot.
-
No n8n, veja se o trigger capturou:
chat_id(quem enviou)caption(texto da legenda)photo[](array de versões da imagem em diferentes resoluções).
Resultado esperado do Passo 1: Você tem no n8n a entrada do usuário já estruturada, pronta para usar: chat_id, caption e file_id da foto.
Beleza — em nível macro, o passo a passo se resume a 5 grandes etapas:
-
Entrada do usuário Receber foto + legenda pelo Telegram.
-
Preparação da imagem Analisar a foto, criar prompt estruturado e gerar a imagem consistente (16:9) com Nano Banana.
-
Validação Enviar a imagem para o usuário aprovar ou pedir ajustes.
-
Criação do vídeo Gerar roteiro multi-cena (UGC) e produzir os clipes com Veo3 Fast, mantendo consistência visual.
-
Finalização e entrega Unir as cenas no Fal.ai e devolver o vídeo final 16:9 ao usuário pelo Telegram.
Passo a passo enxuto (16:9, Telegram → vídeo final)
- Preparar contas e credenciais
- Criar Bot no Telegram e copiar o token.
- Criar conta no KIE.ai e Fal.ai; copiar as API keys.
- No n8n: criar credenciais HTTP para KIE.ai e Fal.ai; conferir timezone America/Sao_Paulo. Exemplo de uso: no n8n, selecione as credenciais salvas em cada nó HTTP.
- Receber foto e legenda pelo Telegram
- Nó Telegram Trigger para mensagens com foto + caption.
- Saída usada depois: chat_id, caption e o array photo[]. Exemplo de caption: Criar vídeo 30s anunciando a inauguração da floricultura. Tom natural, foco no sorriso.
- Obter a melhor versão da foto
- Nó HTTP Request getFile do Telegram com o file_id da última posição de photo[] (é a maior resolução).
- Montar URL direta do arquivo: https://api.telegram.org/file/bot{TOKEN}/{file_path} Exemplo de resultado: URL direta da imagem para usar como referência.
- Analisar a imagem
- Nó LLM (gpt-4.1) para descrever pessoa, roupa, cores, cenário, iluminação, objetos.
- Saída estruturada simples (lista de campos). Exemplo de campos: pessoa, expressão, roupa, paleta_cores, cenário, iluminação.
- Criar o prompt de imagem em 16:9
- Nó LLM combinando caption + análise da imagem.
- Saída curta e estável, com campos: image_prompt, style, composition, negatives, aspect_ratio: 16:9. Exemplo de saída: image_prompt descreve a cena e o produto; negatives evita mãos extras, distorções.
- Gerar imagem com Nano Banana usando callback
- Nó HTTP Request para criar tarefa no KIE.ai (modelo nano-banana-edit) com: prompt do passo 5, aspect_ratio 16:9, image_urls [URL do Telegram], callback_url = execução do n8n.
- Nó Wait em modo On Webhook Call para liberar o fluxo quando KIE.ai chamar o callback.
- Nó HTTP Record/Info do KIE.ai para pegar a url da imagem final. Exemplo de resultado: URL da imagem 16:9 gerada e consistente.
- Validar a imagem no Telegram
- Enviar a imagem para o usuário (SendPhoto).
- Send and wait for response com botões: Aprovar | Gerar outra.
- Se “Gerar outra”, coletar feedback curto (ex.: mudar fundo/luz/roupa) e voltar ao passo 5. Exemplo de resposta esperada: usuário aprova a imagem antes de gastar com vídeo.
- Gerar roteiro de vídeo multi-cena 16:9
- Nó LLM para criar estrutura com: total_duration (ex.: 30), scene_length 8, num_scenes = ceil(total/8), scenes[] com prompt e diálogo curto estilo UGC, mantendo o mesmo rosto/estética da imagem aprovada. Exemplo: para 15s, 2 cenas; para 30s, 4 cenas.
- Gerar cada cena com Veo3 Fast
- Dividir scenes[] em itens e, em loop: criar vídeo no KIE.ai (modelo veo3-fast) com prompt/diálogo da cena, aspect_ratio 16:9 e reference_image_urls = [imagem aprovada].
- Aguardar e consultar status até obter as video_urls de todas as cenas. Exemplo de resultado: lista de URLs de clipes 16:9 prontos.
- Unir e entregar o vídeo final
- Nó HTTP no Fal.ai para merge de video_urls na ordem das cenas; aguardar status completed.
- Enviar vídeo final 16:9 ao usuário via Telegram SendVideo.
- Opcional: salvar log (task_id, prompts, urls) em planilha/DB para histórico. Exemplo de encerramento: bot responde com o vídeo final e um “pronto!” simples.
Resumo completo e estruturado do conteúdo:
Visão geral⌗
Mostra como gerar imagens e vídeos hiper-realistas com Nano Banana (Google) e Veo3 Fast, integrados no N8N e controlados por Telegram. A ideia é criar avatares consistentes que podem promover produtos de forma automatizada e barata, com validação antes de gerar os vídeos.
Principais pontos abordados⌗
- Avatares consistentes
- Uma única foto gera várias variações realistas.
- O modelo Nano Banana mantém o mesmo rosto e estilo mesmo mudando cenário, roupas ou produto.
- Processo da automação
- Trigger do Telegram: o usuário envia imagem + legenda.
- IA analisa a foto (cores, roupas, objetos, contexto).
- GPT-4.1 gera prompt detalhado para Nano Banana.
- Nano Banana cria a imagem final.
- Validação via Telegram: aprovar ou pedir nova geração.
- Se aprovado → geração de prompt de vídeo multi-cena estilo UGC.
- Veo3 Fast cria cenas individuais (máx. 8s cada).
- Fal.ai junta os vídeos em um só.
- Bot envia o resultado final no Telegram.
- Validação e consistência
- Uso de
execution.resumeUrlpara evitar loops desnecessários. - Aprovação obrigatória do usuário antes de criar vídeo.
- Possibilidade de feedback textual para ajustar a próxima geração.
- Exemplos práticos mostrados
- Floricultura com modelo fixo promovendo inauguração.
- Alteração de cenários (casa, estádio, bandeiras).
- Testes de consistência em roupas e cenários diferentes.
- Resultados dos vídeos
- Vídeos de 15–30 segundos criados juntando várias cenas de 8s.
- Ainda há limitações de qualidade no Veo3 Fast, mas tende a melhorar.
Ferramentas usadas⌗
- N8N (orquestração)
- Telegram Bot API (interação com usuário)
- GPT-4.1 (geração de prompts estruturados)
- Nano Banana (Google IA – geração de imagens realistas)
- Veo3 Fast (vídeos rápidos)
- Fal.ai (mesclar vídeos)
Custos e vantagens⌗
- Nano Banana custa apenas 0,02 € por imagem (muito barato comparado a outras soluções).
- Elimina necessidade de modelos reais, estúdios ou edições complexas.
- Fluxo pode ser adaptado para web ou formulário, permitindo cobrar por imagens/vídeos sob demanda.
Futuro e melhorias⌗
- Criador vai mostrar em próximas aulas como manter consistência entre vídeos longos, reutilizando o último frame de um para iniciar o seguinte.
- Isso permitirá transições perfeitas e vídeos de maior duração sem cortes perceptíveis.
Conclusão⌗
O fluxo demonstra uma automação poderosa, barata e escalável para criar avatares consistentes em imagens e vídeos UGC. É aplicável para lojas, SaaS, agências, criadores de conteúdo e até influencers virtuais.
e42. Nano Banana + Veo3: UGC espetacular
Você aprende a construir um sistema automatizado que permite gerar avatares personalizados e vídeos UGC hiper-realistas a partir de produtos, usando a nova IA do Google "Nano Banana" integrada no N8N. A automação foi desenhada para funcionar 100% via Telegram, incluindo validação da imagem antes de criar o vídeo final.
🛠️ O que conseguimos com esta automação?
- Gerar vídeos realistas com consistência visual extrema
- Criar avatares personalizados com uma única imagem
- Validar ou rejeitar imagens antes de gerar o vídeo
- Economizar tempo e custos na produção de conteúdo
- Evitar loops desnecessários usando webhooks inteligentes
- Criar um fluxo replicável para SaaS, lojas ou criadores de conteúdo
🧰 Estrutura do fluxo automatizado
- Disparo por Telegram: o bot recebe uma imagem e uma legenda com instruções
- Análise da imagem com IA (cores, pessoa, roupa, etc.)
- Geração do prompt: combina as instruções da legenda com a análise da imagem
- Criação da imagem final com Nano Banana (modo edição)
- Validação via Telegram: envia a imagem e aguarda aprovação ou nova geração
- Geração do prompt de vídeo: com estrutura multi-cena e estilo UGC
- Criação de vídeos usando Veo3 Fast para cada cena
- Agrupamento dos vídeos individuais em um só com Fal.ai
- Envio final do vídeo ao usuário via Telegram
🛠️ Ferramentas utilizadas
- N8N
- Telegram Bot API
- GPT-4.1
- Nano Banana (Google)
- Veo3 Fast (para vídeo)
- Fal.ai (para unir vídeos)
🧠 Conselhos chave que aprendemos
- Usar execution.resumeUrl permite evitar loops e fazer esperas eficientes
- Sempre validar as imagens com o usuário antes de gerar o vídeo final
- Trabalhar com prompts estruturados (YAML ou markdown) melhora a consistência
- Aproveitar plataformas baratas (execuções a partir de 0,02€) para escalar sistemas UGC
- Esse fluxo pode ser adaptado para formulário ou site e vendido como serviço
Resources
- Blueprint vídeos longos
- KIE.AI API VEO 3
- Fal.ai Merge Videos
Consistência brutal! Nano Banana + Veo3 🧠⚡
Isto é um antes e depois para qualquer pessoa que queira fazer imagens realistas de produtos ou marca pessoal. Anexo imagens e vídeo para que veja os resultados 😎
📸 Com uma única imagem, esta automação cria um avatar hiper-realista e consistente que aparece promovendo seu produto...
👁️🗨️ O incrível é a consistência visual: ➡️ Sempre o mesmo modelo, mesmo rosto, mesma estética ➡️ Mesmo que mude o fundo, a roupa ou o produto ➡️ Em cada imagem e em cada cena do vídeo
E como se não bastasse... 🔁 Juntamos múltiplas cenas para criar vídeos longos! Assim você pode gerar conteúdo de 15, 30 ou 60 segundos com o mesmo avatar.
🚀 O que montamos nesta aula? ✅ Imagens geradas com Nano Banana (a nova joia da Google IA) ✅ Diálogos estilo UGC gerados com GPT-4.1 ✅ Vídeos multi-cena com Veo3 Fast ✅ Agrupamento final com Fai.ai ✅ Validação de imagem no Telegram antes de lançar o vídeo ✅ Tudo automatizado com N8N
Isso pode ser aplicado se você é marca, loja, SaaS, agência, consultor, influenciador ou vende na Amazon. Agora você pode ter seu próprio modelo de marca, em vídeo, dizendo o que quiser, quando quiser… por US\$ 0,02 (imagem com Nano Banana).
- Nano Banana + Veo3: UGC espetacular
e42 - Nano Banana + Veo3: UGC espetacular
1