cerebro-vip INEMA.CLUB
inícioINEMA.N8N

Aula prática (e42) sobre automação N8N para geração de imagens e…

INEMA.N8N · 2025-08-28 · ~17 min · ver no Telegram ↗

INEMA

Apêndice de Exemplos — só os trechos técnicos (YAML, JSON, curl, expressões n8n) para você usar como referência rápida.


Exemplo 1 – Prompt de Imagem (YAML simples, 16:9)

image_prompt: mulher jovem sorridente segurando um buquê em frente à floricultura style: realista, iluminação suave, lente 50mm composition: plano médio, foco no rosto e no produto aspect_ratio: 16:9 negatives: mãos extras, distorções faciais, texto ilegível, logotipos reais


Exemplo 2 – Prompt de Vídeo (YAML multi-cena)

total_duration: 30 scene_length: 8 num_scenes: 4 aspect_ratio: 16:9 scenes: - id: 1 prompt: a modelo apresenta a loja em plano médio dialogue: "Oi pessoal… nossa floricultura vai abrir na próxima semana!" - id: 2 prompt: close no buquê de flores em mãos dialogue: "Olha só que flores incríveis… tudo fresquinho." - id: 3 prompt: plano geral da fachada da loja dialogue: "Estamos preparando um espaço muito especial…" - id: 4 prompt: a modelo sorri e acena na frente da loja dialogue: "Venha nos visitar e ganhe um presente exclusivo!"


Exemplo 3 – cURL Nano Banana (criar imagem)

curl -X POST https://api.kie.ai/v1/images/create \ -H "Authorization: Bearer SUA_KIE_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model":"nano-banana-edit", "prompt":"mulher sorridente segurando buquê em floricultura, realista, 16:9", "aspect_ratio":"16:9", "image_urls":["https://api.telegram.org/file/botSEU_TOKEN/FILE_PATH"], "callback_url":"{{$execution.resumeUrl}}" }'


Exemplo 4 – cURL Veo3 Fast (gerar cena de vídeo)

curl -X POST https://api.kie.ai/v1/videos/create \ -H "Authorization: Bearer SUA_KIE_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model":"veo3-fast", "prompt":"a modelo apresenta a floricultura sorrindo", "dialogue":"Nossa loja abre semana que vem… estamos te esperando!", "aspect_ratio":"16:9", "reference_image_urls":["https://meu-servidor.com/imagem_aprovada.jpg"] }'


Exemplo 5 – cURL Fal.ai (merge vídeos)

curl -X POST https://api.fal.ai/v1/merge_videos \ -H "Authorization: Bearer SUA_FAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "video_urls":["https://cdn.kie.ai/cena1.mp4","https://cdn.kie.ai/cena2.mp4"], "transitions":"none" }'


Exemplo 6 – Expressão n8n (pegar última foto do Telegram)

{{$json["photo"][$json["photo"].length - 1].file_id}}


Exemplo 7 – Expressão n8n (parsear JSON de resposta)

{{ JSON.parse($json.data).image_url }}


✅ Com esse apêndice, você tem:

  • Modelos prontos de prompts (imagem + vídeo).
  • Comandos cURL reais para testar fora do n8n.
  • Expressões típicas do n8n para lidar com Telegram e respostas de API.

**Hacks – ** (diretos, sem enrolar, só truques aplicáveis para turbinar o fluxo):


Hacks de Consistência

  1. Mais de uma imagem de referência → passe 2–3 ângulos do rosto/produto para o Nano Banana → avatar fica idêntico em todas as variações.
  2. Travar aspecto 16:9 em todos os pontos → inclua aspect_ratio: 16:9 tanto no prompt quanto no body da API → evita cortes.
  3. Usar “negatives” sempre → bloqueie distorções típicas: mãos extras, olhos tortos, texto ilegível.
  4. Roupa-âncora → sempre inclua uma peça fixa (ex.: jaqueta vermelha) → reforça consistência entre cenas.

Hacks de Prompt

  1. YAML/JSON curto → menos campos = menos erro. Foco só em: image_prompt, style, aspect_ratio, negatives.
  2. Diálogo UGC natural → 25–30 palavras, tom de conversa com amigo, nunca tom de anúncio.
  3. Cena = objetivo único → cada cena mostra só 1 coisa: (apresentar, detalhe, call-to-action leve).

Hacks de Telegram

  1. Sempre pegar última foto do array → é a de maior qualidade.
  2. Teclado inline para respostas → botões [Aprovar] [Gerar outra] → fluxo mais rápido e barato.
  3. Feedback guiado → se “Gerar outra”, peça campos fixos: “Trocar fundo / Ajustar luz / Mudar roupa” → menos tentativa e erro.

Hacks de Automação (n8n)

  1. Use execution.resumeUrl → evite loops de checagem, mais barato e rápido.
  2. Salvar task_id e urls em planilha → facilita reuso, auditoria e suporte.
  3. Retry exponencial simples → 5s → 15s → 30s → evita falhas de rede sem gastar muito.

Hacks de Custo e Escala

  1. Gate obrigatório → só gerar vídeo após aprovação da imagem → corta 70% de gasto desnecessário.
  2. Cache de avatar → se o mesmo usuário pedir de novo, reuse referência aprovada → custo quase zero para repetir rosto.
  3. Fila simples → limite 2–3 jobs por vez → evita rate-limit e travamentos.

Hacks de Qualidade Extra

  1. Feedback textual no loop → se imagem não agradar, deixe o usuário digitar ajuste → IA melhora na próxima rodada.
  2. Evitar “tom vendedor” no vídeo → diálogo mais realista aumenta retenção (o público não pula).
  3. Close-ups intercalados → peça 1 cena de close no produto → aumenta impacto sem perder consistência.
  4. Juntar áudio depois → se usar TTS, processe separado e sincronize → voz mais limpa.

Passo 5 (Finalização e Entrega) de forma direta e prática:


Passo 5 — Finalização e Entrega

  1. Unir todas as cenas em um só vídeo
  • Use um nó HTTP Request (POST) para o Fal.ai.
  • Body:

    { "video_urls": ["{{urlCena1}}","{{urlCena2}}","{{urlCena3}}","{{urlCena4}}"], "transitions": "none" } * Resposta: request_id para acompanhar o processamento.

  1. Esperar o merge terminar
  • Use Wait (tempo fixo \~30s) ou loop de checagem no endpoint get_result do Fal.ai.
  • Condição: status = completed.
  • Saída: final_video_url (link do vídeo final em 16:9).
  1. Enviar vídeo final pelo Telegram
  • Use Telegram → SendVideo.
  • Input: chat_id do usuário + final_video_url.
  • Mensagem de acompanhamento: “Aqui está seu vídeo final! 🎬”
  1. (Opcional) Salvar log do job
  • Em planilha ou DB (Supabase, Airtable, Google Sheets).
  • Campos úteis: chat_id, legenda original, prompt usado, urls das cenas, url final, data/hora, custo estimado.

Resultado esperado do Passo 5: O usuário recebe no Telegram um vídeo único em 16:9, com múltiplas cenas unidas, consistência visual mantida e pronto para uso em redes sociais.

Passo 4 (Criação do Vídeo) de forma direta e prática:


Passo 4 — Criação do Vídeo

  1. Gerar roteiro multi-cena estilo UGC
  • Use um nó OpenAI Chat (gpt-4.1).
  • Entrada:

    • Texto da legenda do usuário.
    • Análise da imagem aprovada.
    • URL da imagem final aprovada.
    • Peça uma saída estruturada:

    total_duration: 30 # duração total em segundos scene_length: 8 # duração de cada cena (~8s) num_scenes: 4 # calculado = ceil(total/scene_length) aspect_ratio: 16:9 scenes: - id: 1 prompt: descrição da cena dialogue: fala curta e natural, até 30 palavras - id: 2 prompt: ... dialogue: ...

  1. Separar cenas para loop
  • Use Split In Batches ou Item Lists no n8n.
  • Cada item = 1 cena com prompt + dialogue.
  1. Gerar cada cena com Veo3 Fast
  • Para cada cena, use um nó HTTP Request (POST) no KIE.ai.
  • Body mínimo:

    { "model": "veo3-fast", "prompt": "{{prompt_da_cena}}", "dialogue": "{{dialogue_da_cena}}", "aspect_ratio": "16:9", "reference_image_urls": ["{{URL_IMAGEM_APROVADA}}"] } * Resultado: task_id de cada vídeo.

  1. Esperar vídeos ficarem prontos
  • Use um Wait (tempo fixo, ex. 60s) ou um loop de checagem com o endpoint record/info do KIE.ai.
  • Condição de saída: status = success.
  • Guarde todas as video_urls em uma lista.

Resultado esperado do Passo 4: Você terá uma lista de clipes de 8–10s cada, em 16:9, todos com o mesmo avatar e estilo visual.

Passo 3 (Validação da Imagem) de forma direta e prática:


Passo 3 — Validação da Imagem

  1. Gerar a imagem com Nano Banana
  • Use um nó HTTP Request (POST) para o KIE.ai.
  • Modelo: nano-banana-edit.
  • Body mínimo:

    { "model": "nano-banana-edit", "prompt": "{{prompt_estruturado}}", "aspect_ratio": "16:9", "image_urls": ["{{URL_IMAGEM_TELEGRAM}}"], "callback_url": "{{$execution.resumeUrl}}" } * O callback_url faz com que o KIE.ai avise o n8n quando terminar (sem precisar de loop de checagem).

  1. Esperar o retorno
  • Adicione um nó Wait configurado em modo On Webhook Call.
  • Assim que o KIE.ai terminar, o fluxo continua automaticamente.
  1. Pegar a imagem final
  • Use um nó HTTP Request (GET) para o endpoint record/info do KIE.ai.
  • Passe o task_id da criação.
  • Extraia a URL da imagem gerada.
  1. Enviar a imagem ao usuário para validação
  • Use um nó Telegram SendPhoto.
  • Envie a imagem gerada + uma mensagem tipo: “Aqui está a imagem gerada. Deseja aprovar ou gerar outra?”
  1. Receber resposta do usuário
  • Use Telegram → Send and wait for response.
  • Configure botões: [Aprovar] | [Gerar outra].
  1. Tratar a resposta
  • Se [Aprovar] → segue para o próximo passo (roteiro do vídeo).
  • Se [Gerar outra] → volte ao Passo 2 (criar novo prompt).

    • Opcional: permita que o usuário escreva o que quer mudar (ex.: “trocar fundo” ou “mais iluminação”) e inclua esse feedback no próximo prompt.

Resultado esperado do Passo 3: O usuário aprova uma imagem 16:9 consistente, que servirá como base para o vídeo.

Passo 2 (Preparação da imagem) detalhado de forma direta e prática:


Passo 2 — Preparação da Imagem

  1. Pegar a melhor versão da foto
  • No output do Telegram Trigger, a foto vem em um array photo[].
  • Sempre use a última posição (maior resolução).
  • Expressão no n8n:

    {{$json["photo"][$json["photo"].length - 1].file_id}}

  1. Gerar a URL direta da imagem ** * Use um nó HTTP Request (Telegram getFile).** * Endpoint:

    ``` api.telegram.org ↗

`` * A resposta traz file_path. ` * Monte a URL final:

   ```   https://api.telegram.org/file/bot{{BOT_TOKEN}}/{{file_path}}

```3. Ana**lisar a imagem com IA

** * Use um nó Ope**nAI Chat (gpt-4.1). ** * Entrada: URL da imagem. * Peça saída estruturada simples:

 * pessoa
 * roupa
 * expressão
 * cenário
 * paleta de cores
 * iluminação

Exemplo de instrução:

  ```Analise a imagem enviada.

Retorne JSON com: pessoa, roupa, expressão, cenário, paleta_cores, iluminação.

4```. Criar prompt de imagem 16:9

** * Use outro Open**AI Chat (gpt-4.1). * Combine:

 * caption do usuário (texto que ele mandou)
 * análise da imagem (resultado do passo anterior)
  • Saída final (em YAML ou JSON):
     ``` image_prompt: descrição objetiva da cena
    

    style: realista, iluminação suave, foco no rosto/produto
    composition: plano médio, enquadramento central
    aspect_ratio: 16:9
    negatives: mãos extras, distorção de rosto, logos reais

--```-

✅ Resultado esperado do Passo 2: Você terá a URL direta da foto do Telegram + um prompt estruturado 16:9 pronto para enviar ao modelo Nano Banana.


o Passo 1 (Entrada do usuário) de forma direta, prática e útil para alguém configurar no n8n:


Passo 1 — Entrada do usuário (Telegram)

  1. Criar o bot no Telegram
  • Abra o Telegram e fale com o @BotFather.
  • Use o comando /newbot, escolha nome e @username.
  • Copie o token do bot que ele entregar (ex.: 123456:ABC-DEF...).
  1. Configurar o nó Telegram Trigger no n8n
  • Adicione um Telegram Trigger Node.
  • Nas credenciais, cole o token do bot criado.
  • Configure para ouvir mensagens.
  • Ative receber foto + legenda (caption).
  1. Testar o gatilho
  • No Telegram, envie uma foto com uma mensagem de texto na legenda para o bot.
  • No n8n, veja se o trigger capturou:

    • chat_id (quem enviou)
    • caption (texto da legenda)
    • photo[] (array de versões da imagem em diferentes resoluções).

Resultado esperado do Passo 1: Você tem no n8n a entrada do usuário já estruturada, pronta para usar: chat_id, caption e file_id da foto.

Beleza — em nível macro, o passo a passo se resume a 5 grandes etapas:

  1. Entrada do usuário Receber foto + legenda pelo Telegram.

  2. Preparação da imagem Analisar a foto, criar prompt estruturado e gerar a imagem consistente (16:9) com Nano Banana.

  3. Validação Enviar a imagem para o usuário aprovar ou pedir ajustes.

  4. Criação do vídeo Gerar roteiro multi-cena (UGC) e produzir os clipes com Veo3 Fast, mantendo consistência visual.

  5. Finalização e entrega Unir as cenas no Fal.ai e devolver o vídeo final 16:9 ao usuário pelo Telegram.

Passo a passo enxuto (16:9, Telegram → vídeo final)

  1. Preparar contas e credenciais
  • Criar Bot no Telegram e copiar o token.
  • Criar conta no KIE.ai e Fal.ai; copiar as API keys.
  • No n8n: criar credenciais HTTP para KIE.ai e Fal.ai; conferir timezone America/Sao_Paulo. Exemplo de uso: no n8n, selecione as credenciais salvas em cada nó HTTP.
  1. Receber foto e legenda pelo Telegram
  • Nó Telegram Trigger para mensagens com foto + caption.
  • Saída usada depois: chat_id, caption e o array photo[]. Exemplo de caption: Criar vídeo 30s anunciando a inauguração da floricultura. Tom natural, foco no sorriso.
  1. Obter a melhor versão da foto
  • Nó HTTP Request getFile do Telegram com o file_id da última posição de photo[] (é a maior resolução).
  • Montar URL direta do arquivo: https://api.telegram.org/file/bot{TOKEN}/{file_path} Exemplo de resultado: URL direta da imagem para usar como referência.
  1. Analisar a imagem
  • Nó LLM (gpt-4.1) para descrever pessoa, roupa, cores, cenário, iluminação, objetos.
  • Saída estruturada simples (lista de campos). Exemplo de campos: pessoa, expressão, roupa, paleta_cores, cenário, iluminação.
  1. Criar o prompt de imagem em 16:9
  • Nó LLM combinando caption + análise da imagem.
  • Saída curta e estável, com campos: image_prompt, style, composition, negatives, aspect_ratio: 16:9. Exemplo de saída: image_prompt descreve a cena e o produto; negatives evita mãos extras, distorções.
  1. Gerar imagem com Nano Banana usando callback
  • Nó HTTP Request para criar tarefa no KIE.ai (modelo nano-banana-edit) com: prompt do passo 5, aspect_ratio 16:9, image_urls [URL do Telegram], callback_url = execução do n8n.
  • Nó Wait em modo On Webhook Call para liberar o fluxo quando KIE.ai chamar o callback.
  • Nó HTTP Record/Info do KIE.ai para pegar a url da imagem final. Exemplo de resultado: URL da imagem 16:9 gerada e consistente.
  1. Validar a imagem no Telegram
  • Enviar a imagem para o usuário (SendPhoto).
  • Send and wait for response com botões: Aprovar | Gerar outra.
  • Se “Gerar outra”, coletar feedback curto (ex.: mudar fundo/luz/roupa) e voltar ao passo 5. Exemplo de resposta esperada: usuário aprova a imagem antes de gastar com vídeo.
  1. Gerar roteiro de vídeo multi-cena 16:9
  • Nó LLM para criar estrutura com: total_duration (ex.: 30), scene_length 8, num_scenes = ceil(total/8), scenes[] com prompt e diálogo curto estilo UGC, mantendo o mesmo rosto/estética da imagem aprovada. Exemplo: para 15s, 2 cenas; para 30s, 4 cenas.
  1. Gerar cada cena com Veo3 Fast
  • Dividir scenes[] em itens e, em loop: criar vídeo no KIE.ai (modelo veo3-fast) com prompt/diálogo da cena, aspect_ratio 16:9 e reference_image_urls = [imagem aprovada].
  • Aguardar e consultar status até obter as video_urls de todas as cenas. Exemplo de resultado: lista de URLs de clipes 16:9 prontos.
  1. Unir e entregar o vídeo final
  • Nó HTTP no Fal.ai para merge de video_urls na ordem das cenas; aguardar status completed.
  • Enviar vídeo final 16:9 ao usuário via Telegram SendVideo.
  • Opcional: salvar log (task_id, prompts, urls) em planilha/DB para histórico. Exemplo de encerramento: bot responde com o vídeo final e um “pronto!” simples.

Resumo completo e estruturado do conteúdo:

Visão geral

Mostra como gerar imagens e vídeos hiper-realistas com Nano Banana (Google) e Veo3 Fast, integrados no N8N e controlados por Telegram. A ideia é criar avatares consistentes que podem promover produtos de forma automatizada e barata, com validação antes de gerar os vídeos.


Principais pontos abordados

  1. Avatares consistentes
  • Uma única foto gera várias variações realistas.
  • O modelo Nano Banana mantém o mesmo rosto e estilo mesmo mudando cenário, roupas ou produto.
  1. Processo da automação
  • Trigger do Telegram: o usuário envia imagem + legenda.
  • IA analisa a foto (cores, roupas, objetos, contexto).
  • GPT-4.1 gera prompt detalhado para Nano Banana.
  • Nano Banana cria a imagem final.
  • Validação via Telegram: aprovar ou pedir nova geração.
  • Se aprovado → geração de prompt de vídeo multi-cena estilo UGC.
  • Veo3 Fast cria cenas individuais (máx. 8s cada).
  • Fal.ai junta os vídeos em um só.
  • Bot envia o resultado final no Telegram.
  1. Validação e consistência
  • Uso de execution.resumeUrl para evitar loops desnecessários.
  • Aprovação obrigatória do usuário antes de criar vídeo.
  • Possibilidade de feedback textual para ajustar a próxima geração.
  1. Exemplos práticos mostrados
  • Floricultura com modelo fixo promovendo inauguração.
  • Alteração de cenários (casa, estádio, bandeiras).
  • Testes de consistência em roupas e cenários diferentes.
  1. Resultados dos vídeos
  • Vídeos de 15–30 segundos criados juntando várias cenas de 8s.
  • Ainda há limitações de qualidade no Veo3 Fast, mas tende a melhorar.

Ferramentas usadas

  • N8N (orquestração)
  • Telegram Bot API (interação com usuário)
  • GPT-4.1 (geração de prompts estruturados)
  • Nano Banana (Google IA – geração de imagens realistas)
  • Veo3 Fast (vídeos rápidos)
  • Fal.ai (mesclar vídeos)

Custos e vantagens

  • Nano Banana custa apenas 0,02 € por imagem (muito barato comparado a outras soluções).
  • Elimina necessidade de modelos reais, estúdios ou edições complexas.
  • Fluxo pode ser adaptado para web ou formulário, permitindo cobrar por imagens/vídeos sob demanda.

Futuro e melhorias

  • Criador vai mostrar em próximas aulas como manter consistência entre vídeos longos, reutilizando o último frame de um para iniciar o seguinte.
  • Isso permitirá transições perfeitas e vídeos de maior duração sem cortes perceptíveis.

Conclusão

O fluxo demonstra uma automação poderosa, barata e escalável para criar avatares consistentes em imagens e vídeos UGC. É aplicável para lojas, SaaS, agências, criadores de conteúdo e até influencers virtuais.

e42. Nano Banana + Veo3: UGC espetacular

Você aprende a construir um sistema automatizado que permite gerar avatares personalizados e vídeos UGC hiper-realistas a partir de produtos, usando a nova IA do Google "Nano Banana" integrada no N8N. A automação foi desenhada para funcionar 100% via Telegram, incluindo validação da imagem antes de criar o vídeo final.

🛠️ O que conseguimos com esta automação?

  • Gerar vídeos realistas com consistência visual extrema
  • Criar avatares personalizados com uma única imagem
  • Validar ou rejeitar imagens antes de gerar o vídeo
  • Economizar tempo e custos na produção de conteúdo
  • Evitar loops desnecessários usando webhooks inteligentes
  • Criar um fluxo replicável para SaaS, lojas ou criadores de conteúdo

🧰 Estrutura do fluxo automatizado

  • Disparo por Telegram: o bot recebe uma imagem e uma legenda com instruções
  • Análise da imagem com IA (cores, pessoa, roupa, etc.)
  • Geração do prompt: combina as instruções da legenda com a análise da imagem
  • Criação da imagem final com Nano Banana (modo edição)
  • Validação via Telegram: envia a imagem e aguarda aprovação ou nova geração
  • Geração do prompt de vídeo: com estrutura multi-cena e estilo UGC
  • Criação de vídeos usando Veo3 Fast para cada cena
  • Agrupamento dos vídeos individuais em um só com Fal.ai
  • Envio final do vídeo ao usuário via Telegram

🛠️ Ferramentas utilizadas

  • N8N
  • Telegram Bot API
  • GPT-4.1
  • Nano Banana (Google)
  • Veo3 Fast (para vídeo)
  • Fal.ai (para unir vídeos)

🧠 Conselhos chave que aprendemos

  • Usar execution.resumeUrl permite evitar loops e fazer esperas eficientes
  • Sempre validar as imagens com o usuário antes de gerar o vídeo final
  • Trabalhar com prompts estruturados (YAML ou markdown) melhora a consistência
  • Aproveitar plataformas baratas (execuções a partir de 0,02€) para escalar sistemas UGC
  • Esse fluxo pode ser adaptado para formulário ou site e vendido como serviço

Resources

  • Blueprint vídeos longos
  • KIE.AI API VEO 3
  • Fal.ai Merge Videos

fal.ai ↗

docs.kie.ai ↗

Consistência brutal! Nano Banana + Veo3 🧠⚡

Isto é um antes e depois para qualquer pessoa que queira fazer imagens realistas de produtos ou marca pessoal. Anexo imagens e vídeo para que veja os resultados 😎

📸 Com uma única imagem, esta automação cria um avatar hiper-realista e consistente que aparece promovendo seu produto...

👁️‍🗨️ O incrível é a consistência visual: ➡️ Sempre o mesmo modelo, mesmo rosto, mesma estética ➡️ Mesmo que mude o fundo, a roupa ou o produto ➡️ Em cada imagem e em cada cena do vídeo

E como se não bastasse... 🔁 Juntamos múltiplas cenas para criar vídeos longos! Assim você pode gerar conteúdo de 15, 30 ou 60 segundos com o mesmo avatar.

🚀 O que montamos nesta aula? ✅ Imagens geradas com Nano Banana (a nova joia da Google IA) ✅ Diálogos estilo UGC gerados com GPT-4.1 ✅ Vídeos multi-cena com Veo3 Fast ✅ Agrupamento final com Fai.ai ✅ Validação de imagem no Telegram antes de lançar o vídeo ✅ Tudo automatizado com N8N

Isso pode ser aplicado se você é marca, loja, SaaS, agência, consultor, influenciador ou vende na Amazon. Agora você pode ter seu próprio modelo de marca, em vídeo, dizendo o que quiser, quando quiser… por US\$ 0,02 (imagem com Nano Banana).

  1. Nano Banana + Veo3: UGC espetacular

e42 - Nano Banana + Veo3: UGC espetacular

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗