Aula prática (e42) sobre automação N8N para geração de imagens e…

INEMA

Apêndice de Exemplos — só os trechos técnicos (YAML, JSON, curl, expressões n8n) para você usar como referência rápida.

Exemplo 1 – Prompt de Imagem (YAML simples, 16:9)⌗

image_prompt: mulher jovem sorridente segurando um buquê em frente à floricultura style: realista, iluminação suave, lente 50mm composition: plano médio, foco no rosto e no produto aspect_ratio: 16:9 negatives: mãos extras, distorções faciais, texto ilegível, logotipos reais

Exemplo 2 – Prompt de Vídeo (YAML multi-cena)⌗

total_duration: 30 scene_length: 8 num_scenes: 4 aspect_ratio: 16:9 scenes: - id: 1 prompt: a modelo apresenta a loja em plano médio dialogue: "Oi pessoal… nossa floricultura vai abrir na próxima semana!" - id: 2 prompt: close no buquê de flores em mãos dialogue: "Olha só que flores incríveis… tudo fresquinho." - id: 3 prompt: plano geral da fachada da loja dialogue: "Estamos preparando um espaço muito especial…" - id: 4 prompt: a modelo sorri e acena na frente da loja dialogue: "Venha nos visitar e ganhe um presente exclusivo!"

Exemplo 3 – cURL Nano Banana (criar imagem)⌗

curl -X POST https://api.kie.ai/v1/images/create \ -H "Authorization: Bearer SUA_KIE_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model":"nano-banana-edit", "prompt":"mulher sorridente segurando buquê em floricultura, realista, 16:9", "aspect_ratio":"16:9", "image_urls":["https://api.telegram.org/file/botSEU_TOKEN/FILE_PATH"], "callback_url":"{{$execution.resumeUrl}}" }'

Exemplo 4 – cURL Veo3 Fast (gerar cena de vídeo)⌗

curl -X POST https://api.kie.ai/v1/videos/create \ -H "Authorization: Bearer SUA_KIE_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model":"veo3-fast", "prompt":"a modelo apresenta a floricultura sorrindo", "dialogue":"Nossa loja abre semana que vem… estamos te esperando!", "aspect_ratio":"16:9", "reference_image_urls":["https://meu-servidor.com/imagem_aprovada.jpg"] }'

Exemplo 5 – cURL Fal.ai (merge vídeos)⌗

curl -X POST https://api.fal.ai/v1/merge_videos \ -H "Authorization: Bearer SUA_FAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "video_urls":["https://cdn.kie.ai/cena1.mp4","https://cdn.kie.ai/cena2.mp4"], "transitions":"none" }'

Exemplo 6 – Expressão n8n (pegar última foto do Telegram)⌗

{{$json["photo"][$json["photo"].length - 1].file_id}}

Exemplo 7 – Expressão n8n (parsear JSON de resposta)⌗

{{ JSON.parse($json.data).image_url }}

✅ Com esse apêndice, você tem:

Modelos prontos de prompts (imagem + vídeo).
Comandos cURL reais para testar fora do n8n.
Expressões típicas do n8n para lidar com Telegram e respostas de API.

**Hacks – ** (diretos, sem enrolar, só truques aplicáveis para turbinar o fluxo):

Hacks de Consistência⌗

Mais de uma imagem de referência → passe 2–3 ângulos do rosto/produto para o Nano Banana → avatar fica idêntico em todas as variações.
Travar aspecto 16:9 em todos os pontos → inclua aspect_ratio: 16:9 tanto no prompt quanto no body da API → evita cortes.
Usar “negatives” sempre → bloqueie distorções típicas: mãos extras, olhos tortos, texto ilegível.
Roupa-âncora → sempre inclua uma peça fixa (ex.: jaqueta vermelha) → reforça consistência entre cenas.

Hacks de Prompt⌗

YAML/JSON curto → menos campos = menos erro. Foco só em: image_prompt, style, aspect_ratio, negatives.
Diálogo UGC natural → 25–30 palavras, tom de conversa com amigo, nunca tom de anúncio.
Cena = objetivo único → cada cena mostra só 1 coisa: (apresentar, detalhe, call-to-action leve).

Hacks de Telegram⌗

Sempre pegar última foto do array → é a de maior qualidade.
Teclado inline para respostas → botões [Aprovar] [Gerar outra] → fluxo mais rápido e barato.
Feedback guiado → se “Gerar outra”, peça campos fixos: “Trocar fundo / Ajustar luz / Mudar roupa” → menos tentativa e erro.

Hacks de Automação (n8n)⌗

Use execution.resumeUrl → evite loops de checagem, mais barato e rápido.
Salvar task_id e urls em planilha → facilita reuso, auditoria e suporte.
Retry exponencial simples → 5s → 15s → 30s → evita falhas de rede sem gastar muito.

Hacks de Custo e Escala⌗

Gate obrigatório → só gerar vídeo após aprovação da imagem → corta 70% de gasto desnecessário.
Cache de avatar → se o mesmo usuário pedir de novo, reuse referência aprovada → custo quase zero para repetir rosto.
Fila simples → limite 2–3 jobs por vez → evita rate-limit e travamentos.

Hacks de Qualidade Extra⌗

Feedback textual no loop → se imagem não agradar, deixe o usuário digitar ajuste → IA melhora na próxima rodada.
Evitar “tom vendedor” no vídeo → diálogo mais realista aumenta retenção (o público não pula).
Close-ups intercalados → peça 1 cena de close no produto → aumenta impacto sem perder consistência.
Juntar áudio depois → se usar TTS, processe separado e sincronize → voz mais limpa.

Passo 5 (Finalização e Entrega) de forma direta e prática:

Passo 5 — Finalização e Entrega⌗

Unir todas as cenas em um só vídeo

Use um nó HTTP Request (POST) para o Fal.ai.
Body:

{ "video_urls": ["{{urlCena1}}","{{urlCena2}}","{{urlCena3}}","{{urlCena4}}"], "transitions": "none" } * Resposta: request_id para acompanhar o processamento.

Esperar o merge terminar

Use Wait (tempo fixo \~30s) ou loop de checagem no endpoint get_result do Fal.ai.
Condição: status = completed.
Saída: final_video_url (link do vídeo final em 16:9).

Enviar vídeo final pelo Telegram

Use Telegram → SendVideo.
Input: chat_id do usuário + final_video_url.
Mensagem de acompanhamento: “Aqui está seu vídeo final! 🎬”

(Opcional) Salvar log do job

Em planilha ou DB (Supabase, Airtable, Google Sheets).
Campos úteis: chat_id, legenda original, prompt usado, urls das cenas, url final, data/hora, custo estimado.

✅ Resultado esperado do Passo 5: O usuário recebe no Telegram um vídeo único em 16:9, com múltiplas cenas unidas, consistência visual mantida e pronto para uso em redes sociais.

Passo 4 (Criação do Vídeo) de forma direta e prática:

Passo 4 — Criação do Vídeo⌗

Gerar roteiro multi-cena estilo UGC

Use um nó OpenAI Chat (gpt-4.1).
Entrada:
- Texto da legenda do usuário.
- Análise da imagem aprovada.
- URL da imagem final aprovada.
- Peça uma saída estruturada:
total_duration: 30 # duração total em segundos scene_length: 8 # duração de cada cena (~8s) num_scenes: 4 # calculado = ceil(total/scene_length) aspect_ratio: 16:9 scenes: - id: 1 prompt: descrição da cena dialogue: fala curta e natural, até 30 palavras - id: 2 prompt: ... dialogue: ...

Separar cenas para loop

Use Split In Batches ou Item Lists no n8n.
Cada item = 1 cena com prompt + dialogue.

Gerar cada cena com Veo3 Fast

Para cada cena, use um nó HTTP Request (POST) no KIE.ai.
Body mínimo:

{ "model": "veo3-fast", "prompt": "{{prompt_da_cena}}", "dialogue": "{{dialogue_da_cena}}", "aspect_ratio": "16:9", "reference_image_urls": ["{{URL_IMAGEM_APROVADA}}"] } * Resultado: task_id de cada vídeo.

Esperar vídeos ficarem prontos

Use um Wait (tempo fixo, ex. 60s) ou um loop de checagem com o endpoint record/info do KIE.ai.
Condição de saída: status = success.
Guarde todas as video_urls em uma lista.

✅ Resultado esperado do Passo 4: Você terá uma lista de clipes de 8–10s cada, em 16:9, todos com o mesmo avatar e estilo visual.

Passo 3 (Validação da Imagem) de forma direta e prática:

Passo 3 — Validação da Imagem⌗

Gerar a imagem com Nano Banana

Use um nó HTTP Request (POST) para o KIE.ai.
Modelo: nano-banana-edit.
Body mínimo:

{ "model": "nano-banana-edit", "prompt": "{{prompt_estruturado}}", "aspect_ratio": "16:9", "image_urls": ["{{URL_IMAGEM_TELEGRAM}}"], "callback_url": "{{$execution.resumeUrl}}" } * O callback_url faz com que o KIE.ai avise o n8n quando terminar (sem precisar de loop de checagem).

Esperar o retorno

Adicione um nó Wait configurado em modo On Webhook Call.
Assim que o KIE.ai terminar, o fluxo continua automaticamente.

Pegar a imagem final

Use um nó HTTP Request (GET) para o endpoint record/info do KIE.ai.
Passe o task_id da criação.
Extraia a URL da imagem gerada.

Enviar a imagem ao usuário para validação

Use um nó Telegram SendPhoto.
Envie a imagem gerada + uma mensagem tipo: “Aqui está a imagem gerada. Deseja aprovar ou gerar outra?”

Receber resposta do usuário

Use Telegram → Send and wait for response.
Configure botões: [Aprovar] | [Gerar outra].

Tratar a resposta

Se [Aprovar] → segue para o próximo passo (roteiro do vídeo).
Se [Gerar outra] → volte ao Passo 2 (criar novo prompt).
- Opcional: permita que o usuário escreva o que quer mudar (ex.: “trocar fundo” ou “mais iluminação”) e inclua esse feedback no próximo prompt.

✅ Resultado esperado do Passo 3: O usuário aprova uma imagem 16:9 consistente, que servirá como base para o vídeo.

Passo 2 (Preparação da imagem) detalhado de forma direta e prática:

Passo 2 — Preparação da Imagem⌗

Pegar a melhor versão da foto

No output do Telegram Trigger, a foto vem em um array photo[].
Sempre use a última posição (maior resolução).
Expressão no n8n:

{{$json["photo"][$json["photo"].length - 1].file_id}}

Gerar a URL direta da imagem ** * Use um nó HTTP Request (Telegram getFile).** * Endpoint:

``` api.telegram.org ↗

`` * A resposta traz file_path. ` * Monte a URL final:

   ```   https://api.telegram.org/file/bot{{BOT_TOKEN}}/{{file_path}}

```3. Ana**lisar a imagem com IA

** * Use um nó Ope**nAI Chat (gpt-4.1). ** * Entrada: URL da imagem. * Peça saída estruturada simples:

 * pessoa
 * roupa
 * expressão
 * cenário
 * paleta de cores
 * iluminação

Exemplo de instrução:

  ```Analise a imagem enviada.

Retorne JSON com: pessoa, roupa, expressão, cenário, paleta_cores, iluminação.

4```. Criar prompt de imagem 16:9

** * Use outro Open**AI Chat (gpt-4.1). * Combine:

 * caption do usuário (texto que ele mandou)
 * análise da imagem (resultado do passo anterior)

Saída final (em YAML ou JSON):
```
 ``` image_prompt: descrição objetiva da cena
```
style: realista, iluminação suave, foco no rosto/produto
composition: plano médio, enquadramento central
aspect_ratio: 16:9
negatives: mãos extras, distorção de rosto, logos reais

--```-

✅ Resultado esperado do Passo 2: Você terá a URL direta da foto do Telegram + um prompt estruturado 16:9 pronto para enviar ao modelo Nano Banana.

o Passo 1 (Entrada do usuário) de forma direta, prática e útil para alguém configurar no n8n:

Passo 1 — Entrada do usuário (Telegram)⌗

Criar o bot no Telegram

Abra o Telegram e fale com o @BotFather.
Use o comando /newbot, escolha nome e @username.
Copie o token do bot que ele entregar (ex.: 123456:ABC-DEF...).

Configurar o nó Telegram Trigger no n8n

Adicione um Telegram Trigger Node.
Nas credenciais, cole o token do bot criado.
Configure para ouvir mensagens.
Ative receber foto + legenda (caption).

Testar o gatilho

No Telegram, envie uma foto com uma mensagem de texto na legenda para o bot.
No n8n, veja se o trigger capturou:
- chat_id (quem enviou)
- caption (texto da legenda)
- photo[] (array de versões da imagem em diferentes resoluções).

Resultado esperado do Passo 1: Você tem no n8n a entrada do usuário já estruturada, pronta para usar: chat_id, caption e file_id da foto.

Beleza — em nível macro, o passo a passo se resume a 5 grandes etapas:

Entrada do usuário Receber foto + legenda pelo Telegram.
Preparação da imagem Analisar a foto, criar prompt estruturado e gerar a imagem consistente (16:9) com Nano Banana.
Validação Enviar a imagem para o usuário aprovar ou pedir ajustes.
Criação do vídeo Gerar roteiro multi-cena (UGC) e produzir os clipes com Veo3 Fast, mantendo consistência visual.
Finalização e entrega Unir as cenas no Fal.ai e devolver o vídeo final 16:9 ao usuário pelo Telegram.

Passo a passo enxuto (16:9, Telegram → vídeo final)

Preparar contas e credenciais

Criar Bot no Telegram e copiar o token.
Criar conta no KIE.ai e Fal.ai; copiar as API keys.
No n8n: criar credenciais HTTP para KIE.ai e Fal.ai; conferir timezone America/Sao_Paulo. Exemplo de uso: no n8n, selecione as credenciais salvas em cada nó HTTP.

Receber foto e legenda pelo Telegram

Nó Telegram Trigger para mensagens com foto + caption.
Saída usada depois: chat_id, caption e o array photo[]. Exemplo de caption: Criar vídeo 30s anunciando a inauguração da floricultura. Tom natural, foco no sorriso.

Obter a melhor versão da foto

Nó HTTP Request getFile do Telegram com o file_id da última posição de photo[] (é a maior resolução).
Montar URL direta do arquivo: https://api.telegram.org/file/bot{TOKEN}/{file_path} Exemplo de resultado: URL direta da imagem para usar como referência.

Analisar a imagem

Nó LLM (gpt-4.1) para descrever pessoa, roupa, cores, cenário, iluminação, objetos.
Saída estruturada simples (lista de campos). Exemplo de campos: pessoa, expressão, roupa, paleta_cores, cenário, iluminação.

Criar o prompt de imagem em 16:9

Nó LLM combinando caption + análise da imagem.
Saída curta e estável, com campos: image_prompt, style, composition, negatives, aspect_ratio: 16:9. Exemplo de saída: image_prompt descreve a cena e o produto; negatives evita mãos extras, distorções.

Gerar imagem com Nano Banana usando callback

Nó HTTP Request para criar tarefa no KIE.ai (modelo nano-banana-edit) com: prompt do passo 5, aspect_ratio 16:9, image_urls [URL do Telegram], callback_url = execução do n8n.
Nó Wait em modo On Webhook Call para liberar o fluxo quando KIE.ai chamar o callback.
Nó HTTP Record/Info do KIE.ai para pegar a url da imagem final. Exemplo de resultado: URL da imagem 16:9 gerada e consistente.

Validar a imagem no Telegram

Enviar a imagem para o usuário (SendPhoto).
Send and wait for response com botões: Aprovar | Gerar outra.
Se “Gerar outra”, coletar feedback curto (ex.: mudar fundo/luz/roupa) e voltar ao passo 5. Exemplo de resposta esperada: usuário aprova a imagem antes de gastar com vídeo.

Gerar roteiro de vídeo multi-cena 16:9

Nó LLM para criar estrutura com: total_duration (ex.: 30), scene_length 8, num_scenes = ceil(total/8), scenes[] com prompt e diálogo curto estilo UGC, mantendo o mesmo rosto/estética da imagem aprovada. Exemplo: para 15s, 2 cenas; para 30s, 4 cenas.

Gerar cada cena com Veo3 Fast

Dividir scenes[] em itens e, em loop: criar vídeo no KIE.ai (modelo veo3-fast) com prompt/diálogo da cena, aspect_ratio 16:9 e reference_image_urls = [imagem aprovada].
Aguardar e consultar status até obter as video_urls de todas as cenas. Exemplo de resultado: lista de URLs de clipes 16:9 prontos.

Unir e entregar o vídeo final

Nó HTTP no Fal.ai para merge de video_urls na ordem das cenas; aguardar status completed.
Enviar vídeo final 16:9 ao usuário via Telegram SendVideo.
Opcional: salvar log (task_id, prompts, urls) em planilha/DB para histórico. Exemplo de encerramento: bot responde com o vídeo final e um “pronto!” simples.

Resumo completo e estruturado do conteúdo:

Visão geral⌗

Mostra como gerar imagens e vídeos hiper-realistas com Nano Banana (Google) e Veo3 Fast, integrados no N8N e controlados por Telegram. A ideia é criar avatares consistentes que podem promover produtos de forma automatizada e barata, com validação antes de gerar os vídeos.

Principais pontos abordados⌗

Avatares consistentes

Uma única foto gera várias variações realistas.
O modelo Nano Banana mantém o mesmo rosto e estilo mesmo mudando cenário, roupas ou produto.

Processo da automação

Trigger do Telegram: o usuário envia imagem + legenda.
IA analisa a foto (cores, roupas, objetos, contexto).
GPT-4.1 gera prompt detalhado para Nano Banana.
Nano Banana cria a imagem final.
Validação via Telegram: aprovar ou pedir nova geração.
Se aprovado → geração de prompt de vídeo multi-cena estilo UGC.
Veo3 Fast cria cenas individuais (máx. 8s cada).
Fal.ai junta os vídeos em um só.
Bot envia o resultado final no Telegram.

Validação e consistência

Uso de execution.resumeUrl para evitar loops desnecessários.
Aprovação obrigatória do usuário antes de criar vídeo.
Possibilidade de feedback textual para ajustar a próxima geração.

Exemplos práticos mostrados

Floricultura com modelo fixo promovendo inauguração.
Alteração de cenários (casa, estádio, bandeiras).
Testes de consistência em roupas e cenários diferentes.

Resultados dos vídeos

Vídeos de 15–30 segundos criados juntando várias cenas de 8s.
Ainda há limitações de qualidade no Veo3 Fast, mas tende a melhorar.

Ferramentas usadas⌗

N8N (orquestração)
Telegram Bot API (interação com usuário)
GPT-4.1 (geração de prompts estruturados)
Nano Banana (Google IA – geração de imagens realistas)
Veo3 Fast (vídeos rápidos)
Fal.ai (mesclar vídeos)

Custos e vantagens⌗

Nano Banana custa apenas 0,02 € por imagem (muito barato comparado a outras soluções).
Elimina necessidade de modelos reais, estúdios ou edições complexas.
Fluxo pode ser adaptado para web ou formulário, permitindo cobrar por imagens/vídeos sob demanda.

Futuro e melhorias⌗

Criador vai mostrar em próximas aulas como manter consistência entre vídeos longos, reutilizando o último frame de um para iniciar o seguinte.
Isso permitirá transições perfeitas e vídeos de maior duração sem cortes perceptíveis.

Conclusão⌗

O fluxo demonstra uma automação poderosa, barata e escalável para criar avatares consistentes em imagens e vídeos UGC. É aplicável para lojas, SaaS, agências, criadores de conteúdo e até influencers virtuais.

e42. Nano Banana + Veo3: UGC espetacular

Você aprende a construir um sistema automatizado que permite gerar avatares personalizados e vídeos UGC hiper-realistas a partir de produtos, usando a nova IA do Google "Nano Banana" integrada no N8N. A automação foi desenhada para funcionar 100% via Telegram, incluindo validação da imagem antes de criar o vídeo final.

🛠️ O que conseguimos com esta automação?

Gerar vídeos realistas com consistência visual extrema
Criar avatares personalizados com uma única imagem
Validar ou rejeitar imagens antes de gerar o vídeo
Economizar tempo e custos na produção de conteúdo
Evitar loops desnecessários usando webhooks inteligentes
Criar um fluxo replicável para SaaS, lojas ou criadores de conteúdo

🧰 Estrutura do fluxo automatizado

Disparo por Telegram: o bot recebe uma imagem e uma legenda com instruções
Análise da imagem com IA (cores, pessoa, roupa, etc.)
Geração do prompt: combina as instruções da legenda com a análise da imagem
Criação da imagem final com Nano Banana (modo edição)
Validação via Telegram: envia a imagem e aguarda aprovação ou nova geração
Geração do prompt de vídeo: com estrutura multi-cena e estilo UGC
Criação de vídeos usando Veo3 Fast para cada cena
Agrupamento dos vídeos individuais em um só com Fal.ai
Envio final do vídeo ao usuário via Telegram

🛠️ Ferramentas utilizadas

N8N
Telegram Bot API
GPT-4.1
Nano Banana (Google)
Veo3 Fast (para vídeo)
Fal.ai (para unir vídeos)

🧠 Conselhos chave que aprendemos

Usar execution.resumeUrl permite evitar loops e fazer esperas eficientes
Sempre validar as imagens com o usuário antes de gerar o vídeo final
Trabalhar com prompts estruturados (YAML ou markdown) melhora a consistência
Aproveitar plataformas baratas (execuções a partir de 0,02€) para escalar sistemas UGC
Esse fluxo pode ser adaptado para formulário ou site e vendido como serviço

Resources

Blueprint vídeos longos
KIE.AI API VEO 3
Fal.ai Merge Videos

fal.ai ↗

docs.kie.ai ↗

Consistência brutal! Nano Banana + Veo3 🧠⚡

Isto é um antes e depois para qualquer pessoa que queira fazer imagens realistas de produtos ou marca pessoal. Anexo imagens e vídeo para que veja os resultados 😎

📸 Com uma única imagem, esta automação cria um avatar hiper-realista e consistente que aparece promovendo seu produto...

👁️‍🗨️ O incrível é a consistência visual: ➡️ Sempre o mesmo modelo, mesmo rosto, mesma estética ➡️ Mesmo que mude o fundo, a roupa ou o produto ➡️ Em cada imagem e em cada cena do vídeo

E como se não bastasse... 🔁 Juntamos múltiplas cenas para criar vídeos longos! Assim você pode gerar conteúdo de 15, 30 ou 60 segundos com o mesmo avatar.

🚀 O que montamos nesta aula? ✅ Imagens geradas com Nano Banana (a nova joia da Google IA) ✅ Diálogos estilo UGC gerados com GPT-4.1 ✅ Vídeos multi-cena com Veo3 Fast ✅ Agrupamento final com Fai.ai ✅ Validação de imagem no Telegram antes de lançar o vídeo ✅ Tudo automatizado com N8N

Isso pode ser aplicado se você é marca, loja, SaaS, agência, consultor, influenciador ou vende na Amazon. Agora você pode ter seu próprio modelo de marca, em vídeo, dizendo o que quiser, quando quiser… por US\$ 0,02 (imagem com Nano Banana).

Nano Banana + Veo3: UGC espetacular

e42 - Nano Banana + Veo3: UGC espetacular

chatgpt.com ↗