Aula prática (e40) sobre automação UGC com IA para gerar imagens e…

INEMA

1. Prompt de ANÁLISE DE IMAGEM (OpenAI Vision)⌗

Ele usa um prompt fixo no módulo de análise, algo assim:

“Analise a imagem fornecida e devolva exclusivamente em formato Markdown:
Marca detectada (ou N/A)
Paleta de cores em código HEX com nome e posição
Fonte/estilo tipográfico
Elementos visuais principais
Focar apenas no produto principal
Não incluir explicações extras, apenas o bloco Markdown”

Esse é o prompt que gera a base visual do produto.

2. Prompt do AGENTE (GPT-4.1) para gerar JSON⌗

Aqui ele usa dois blocos: User Prompt e System Prompt.

User Prompt⌗

Pede para criar N cenas com essa estrutura:

prompt_imagem
prompt_video
aspect_ratio_imagem (2:3 ou 16:9)
aspect_ratio_video (9:16 ou 16:9)
modelo_video (Veo3 Fast)

Inclui variáveis:

Número de vídeos (do formulário)
Descrição visual da análise (saída do Vision)
Diálogo fornecido no formulário
Aspect ratio preferido (vertical ou horizontal)
Modelo de vídeo escolhido
Solicitações especiais (ex.: idade do ator, cenário, restrições)

System Prompt⌗

Define o estilo:

Estilo UGC → natural, espontâneo, realista
Foto/vídeo com aparência amadora, tipo celular/iPhone
Imperfeições leves de enquadramento e luz natural
Fidelidade ao produto (marca, cores, logotipo)
Se não houver diálogo, inventar um de até 200 caracteres
Saída sempre em JSON válido

3. Prompt para KIE AI (imagem)⌗

Ele não escreve o prompt na mão, apenas envia o campo "prompt_imagem" gerado pelo agente. Esse prompt descreve a cena fotorrealista:

onde a pessoa está,
como segura o produto,
iluminação,
composição (close, fundo desfocado, etc.).

4. Prompt para KIE AI (vídeo – Veo3 Fast)⌗

Mesma lógica: envia o "prompt_video" gerado pelo agente. Esse prompt inclui:

ambiente,
ator (faixa etária, estilo),
ação simples,
fala/diálogo,
tom realista de selfie.

5. Estrutura Final de Saída (exemplo que ele mostra)⌗

{ "cenas": [ { "prompt_imagem": "Foto amadora em uma sala iluminada pela janela, pessoa segura o produto com logo visível...", "prompt_video": "Vídeo selfie 9:16, ator de 30 anos mostra o produto e diz: 'Essa é a melhor compra que já fiz...'", "aspect_ratio_imagem": "2:3", "aspect_ratio_video": "9:16", "modelo_video": "veo-3-fast" }, ... ] }

Resumindo⌗

Os prompts que ele cita são 3 tipos:

Prompt de análise de imagem (Vision) → extrai marca, cores, fonte, elementos.
Prompt do agente (GPT-4.1) → gera JSON com prompts de imagem e vídeo.
Prompts de imagem e vídeo (campo JSON) → enviados para KIE AI (Veo3 Fast).

"cenas": [ { "prompt_imagem": "...", "prompt_video": "...", "aspect_ratio_imagem": "16:9", "aspect_ratio_video": "16:9", "modelo_video": "veo-3-fast", "duracao_video_seg": 8 } ] } Restrições: - Não distorcer o design original. - Mostrar o logo real quando visível. - Sem textos sobrepostos. Entregue somente o JSON.

Exemplo rápido

quantidade: 4 aspecto: 16:9

6) Dúvidas comuns e respostas curtas⌗

Como garanto 16:9 sempre? Inclua “aspect_ratio_imagem/video: 16:9” em todos os prompts e no mapeamento do node de geração.

Quero vertical para Reels/TikTok. Troque para 9:16 no prompt e nos parâmetros do node de vídeo.

Como impedir que invente variações do produto? Fixe as regras de fidelidade (forma/logo/tipografia/cores HEX) no Sistema e nas Restrições do Usuário.

Posso usar o mesmo ator nas 4 cenas? Sim. Diga explicitamente “o mesmo ator nas 4 cenas”; no curto prazo aumenta realismo de “história contínua”.

Como reduzir custo/tempo? Use Veo3 Fast, 2 cenas em vez de 4, fotos iniciais bem iluminadas, e processe cenas em paralelo (Split Out).

3) Prompt para VÍDEO LONGO SEQUENCIAL (mesmo ator, 4 cenas de \~8s → 30+ s)

Gera 4 cenas coerentes com o mesmo ator e ambiente, para juntar depois.

Sistema

Você cria um roteiro de 4 cenas UGC (cada 7–9s), com o mesmo ator e coerência visual. Regras: 1) Estilo selfie/handheld, luz natural, variações sutis de enquadramento entre cenas. 2) Produto intacto: manter forma, logotipo, tipografia e cores HEX. 3) Em cada cena: micro-objetivo (gancho, benefício, prova prática, CTA). 4) Entregar JSON válido com campos por cena, sem comentários fora do JSON.

Usuário

G```ere um JSON com 4 cenas para um vídeo UGC total ~32s (4 x 8s), em português do Brasil. Parâmetros: - Produto: {{nome_do_produto}} - Análise visual: {{analise_markdown_vision}} - Ambiente geral: {{ambiente}} - Ator: {{faixa_etaria_estilo}}, o mesmo nas 4 cenas - Aspect ratio: 16:9 (ou 9:16 se vertical) Estrutura JSON: { "cenas": [ { "prompt_video": "...", "duracao_seg": 8 }, { "prompt_video": "...", "duracao_seg": 8 }, { "prompt_video": "...", "duracao_seg": 8 }, { "prompt_video": "...", "duracao_seg": 8 } ] } Cada prompt_video deve: - indicar ação/gestos simples, - mencionar 1 benefício diferente, - manter consistência do produto, - sugerir enquadramentos levemente variados, - finalizar a cena 4 com CTA leve. Entregue somente o JSON.

Exemplo curto de saída

{
```  "cenas": [
    { "prompt_video": "Cena 1: selfie na sala, luz da janela; mostra o produto...", "duracao_seg": 8 },
    { "prompt_video": "Cena 2: close nas mãos abrindo a embalagem...", "duracao_seg": 8 },
    { "prompt_video": "Cena 3: demonstração rápida/benefício 2...", "duracao_seg": 8 },
    { "prompt_video": "Cena 4: conclusão com CTA leve...", "duracao_seg": 8 }
  ]
}

```Respostas rápidas

* Como unir as 4 cenas? Baixe os 4 MP4 e una no seu fluxo (ffmpeg, serviço externo ou upload e join).
* E se quiser atores diferentes? Altere para “atores diferentes a cada cena”.

## 4) Prompt para MOCKUP PUBLICITÁRIO (estático para anúncios e vitrines)

Mais barato e rápido; ótimo para thumbnails, carrosséis e capas.

Sistema

Voc```ê gera prompts de mockups publicitários fotorrealistas do produto.
Regras:
1) Fidelidade absoluta ao produto (forma/logo/tipografia/cores HEX).
2) Cenários limpos, com foco no objeto; superfícies realistas (madeira, mármore, tecido).
3) Iluminação suave; sombras coerentes; sem textos ou stickers.
4) Saída somente no prompt final, sem comentários.

U```suário

Crie``` um prompt de mockup publicitário fotorrealista, em português do Brasil:
- Produto: {{nome_do_produto}}
- Análise visual (marca/HEX/tipografia): {{analise_markdown_vision}}
- Superfície: {{madeira_clara | marmore_branco | tecido_neutro}}
- Composição: produto central com logo visível; pequena xícara/planta como apoio opcional.
- Aspect ratio: 16:9 (para capa e YouTube) ou 2:3 (carrossel)
- Sem textos sobrepostos, sem distorções.
Entregue somente o prompt final.

Ex```emplo rápido

Produ```to: Garrafa térmica Inema 500
Superfície: mármore branco
Composição: produto central, logo legível, xícara desfocada ao fundo

Saí```da esperada (resumo):
Mockup 16:9, mármore branco, garrafa Inema 500 fiel (logo e cores HEX), luz suave, sombras realistas, sem textos.

## 5) Prompt-Agente para SAÍDA ÚNICA EM JSON (imagem+vídeo por cena)

Use quando você quer que um único agente gere tudo estruturado para o n8n.

Sistema

Você é``` um gerador de JSON para produção UGC. Produza cenas com prompts de imagem e vídeo sincronizados. Regras:
1) Estilo amador realista; fidelidade total ao produto (forma, logo, tipografia, cores HEX).
2) Se vertical: 9:16; se horizontal: 16:9.
3) Entregue JSON válido, sem comentários fora do JSON.

Usuá```rio

Crie {{quantidade}} cenas UGC para o produto abaixo, retornando JSON:
- Produto: {{nome_do_produto}}
- Diálogo base: {{dialogo_base_ou_vazio}}
- Análise visual (marca/HEX/tipografia): {{analise_markdown_vision}}
- Ambiente preferido: {{ambiente}}
- Pessoa/estilo: {{faixa_etaria_estilo}}
- Aspecto: {{16:9_ou_9:16}}
- Modelo de vídeo: veo-3-fast

JSON alvo:
{

Aqui está o pack de prompts prontos para copiar e colar. Organizei por tópicos e, ao final de cada tópico, incluí exemplos e respostas rápidas às dúvidas mais comuns. Tudo já adaptado para 16:9 por padrão (e com notas para 9:16 quando você quiser vertical).

## 1) Prompt para IMAGEM REALISTA (UGC estático)

Use no seu agente de prompts (ou direto na KIE AI como texto de edição de imagem). Mantém o produto fiel e gera foto estilo “amador premium”.

Sistema

```Você é um gerador de prompts para criar imagens UGC realistas, com aparência de foto feita por pessoas comuns. Regras:
1) Estilo amador, luz natural, micro imperfeições de enquadramento; evitar aparência de IA.
2) Preservar forma do produto, logotipo, tipografia e cores HEX detectadas na análise (não inventar variações).
3) Foco humano e cotidiano: mãos, mesas, ambientes simples, interiores com luz de janela ou exteriores com luz suave.
4) Composição: planos próximos e médios; profundidade de campo sutil; nada de text overlays.
5) Saída somente em texto do prompt final, sem comentários.```

Usuário

C```rie um prompt de imagem UGC única, em português do Brasil, seguindo:
- Produto: {{nome_do_produto}}
- Análise visual: {{analise_markdown_da_vision_com_marca_cores_hex_tipografia_elementos}}
- Objetivo: foto realista do produto em uso ou exibição, sem distorcer forma original.
- Ambiente: {{ambiente_sugerido_ex: sala_luz_de_janela | cafeteria | escritório | carro_estacionado}}
- Pessoas: {{faixa_etaria_e_estilo_ex: 25-40_casual}}, tom espontâneo, expressão natural.
- Restrições: não alterar formato, não cobrir logotipo, não adicionar textos na imagem.
- Aspect ratio preferido: 16:9
- Alternativa se vertical: 9:16

Entregue somente o prompt final da imagem.

Exemplo rápido

Pr```oduto: Garrafa térmica Inema 500 Análise visual: Marca “Inema”, HEX #101820 (preto) e #FFD200 (âmbar), tipografia sans moderna, logotipo centrado. Ambiente: mesa de madeira perto de janela Pessoas: 25-40 casual

```Saída esperada (resumo): Foto horizontal 16:9, luz natural de janela, mão segurando Garrafa térmica Inema 500 intacta (logo visível, cores HEX #101820 e #FFD200 preservadas), mesa de madeira, fundo desfocado suave, estética amadora, sem textos.

Respostas rápidas

Como forçar 16:9? Já está no prompt (aspect ratio preferido: 16:9).
E se eu quiser vertical? Troque para 9:16 no mesmo campo.
Como evitar que a IA mude o produto? Regras 2 e “Restrições” garantem isso.

2) Prompt para VÍDEO UGC CURTO (1 cena, 8–12s)⌗

Use no agente para gerar o prompt que será enviado ao modelo de vídeo (ex.: Veo3 Fast).

Sistema

Voc```ê cria prompts de vídeo UGC curto, naturais e persuasivos, para 8–12 segundos. Regras: 1) Estética selfie/handheld, luz natural, áudio ambiente implícito, micro tremores aceitáveis. 2) Respeitar fielmente forma do produto, logotipo, tipografia e cores HEX; sem adicionar textos na tela. 3) Linguagem coloquial brasileira, tom confidencial, 1 benefício-chave + 1 call-to-action leve. 4) Entregar somente o prompt final do vídeo, sem comentários.

U```suário

Gere``` um prompt de vídeo UGC curto (8–12s), em português do Brasil: - Produto: {{nome_do_produto}} - Diálogo base (se houver): {{dialogo}} - Análise visual (marca/HEX/tipografia): {{analise_markdown_vision}} - Ambiente: {{ambiente}} - Pessoa: {{faixa_etaria_estilo}} - Ação: mostrar o produto em mãos/mesa, close curto; sem distorcer forma. - Aspect ratio: 16:9 (ou 9:16 se vertical) - Call-to-action: suave, ex: “vale a pena testar” Entregue somente o prompt final do vídeo.

Ex```emplo rápido

Produ```to: Manteiga de Amendoim Artesanal Aurora Diálogo base: “É a melhor que já provei, textura cremosa e sem aditivos.” Ambiente: cozinha iluminada de manhã Pessoa: 25–35 casual

Saí```da esperada (resumo): Vídeo 16:9, selfie na cozinha, pessoa mostra pote real da marca (logo e cores idênticos), fala 1 benefício e CTA leve, close nas mãos e textura, luz de janela, sem textos.

Respostas rápidas

Duração fixa? Indique 8–12s no seu node de geração.
Vertical para Reels/TikTok? Troque aspect ratio para 9:16.

Aqui estão os hacks práticos para você turbinar essa automação UGC no n8n com KIE AI, GPT-4o e Evolution API:

Hacks de custo⌗

Sempre use Veo3 Fast: custa \~0,40€ por 8s de vídeo (4 vídeos + 4 imagens por menos de 2€).
Use imagens base bem enquadradas e iluminadas → quanto mais clara a foto inicial, menos tokens e retries você gasta.
Se quiser só variações de cenário, não gere 4 atores diferentes; gere 4 cenas do mesmo ator → economiza porque você pode concatenar depois e publicar como vídeo longo.

Hacks de prompts⌗

No prompt do agente, peça “estilo selfie com celular, luz natural, imperfeições leves” → fica 10x mais realista que “foto profissional”.
Adicione no system prompt: “Não altere a forma do produto. Preserve logo, cores HEX e tipografia originais.”
Para consistência: inclua “o mesmo ator aparece em todas as cenas” ou “atores diferentes a cada cena” dependendo da sua estratégia de marketing.
Se for vender no Instagram/TikTok, force aspect_ratio_video: "9:16" (vertical). Para YouTube ou Ads horizontais, 16:9.

Hacks de automação n8n⌗

Use Split Out para processar várias cenas em paralelo → reduz tempo de espera de 20min para 5min.
Coloque um Wait dinâmico (5s para imagens, 10s para vídeos) e um loop IF success_flag==0. Isso evita travar ou quebrar a execução.
Adicione um limite de tentativas (ex: 80 loops) para não cair em loop infinito caso a API falhe.
No Webhook inicial, já trate o número de WhatsApp removendo o + → evita erro no Evolution API.

Hacks de entrega⌗

Em vez de enviar o vídeo inteiro pelo WhatsApp (que às vezes falha), envie o link MP4 do Drive → abre direto e não corrompe.
Se quiser “impacto social”, adicione uma legenda automática curta tipo “🔥 Testei esse produto e fiquei de cara!” no envio do vídeo.
Use Evolution API → Send Text junto com o link para simular “storytelling” (imagem primeiro, depois link de vídeo).

Hacks criativos⌗

Combine 4 cenas em sequência do mesmo ator → vira um vídeo de 30+ segundos sem parecer gerado em partes.
Crie variações de cenário (casa, carro, rua, café) e publique como se fossem diferentes clientes.
Aproveite o campo solicitações especiais para micro-detalhes (idade, luz, local, humor). Isso deixa cada vídeo único.
Gere extras baratos: imagens estáticas estilo mockup para anúncios → custam só 0,06€ cada.

das com respostas

Como forçar horizontal 16:9? → No agente, defina aspect_ratio_video: "16:9" e aspect_ratio_imagem: "16:9" quando desejar fotos horizontais.

Posso usar Typeform em vez de Google Forms? → Sim. Basta mapear os campos no Webhook do n8n do mesmo jeito.

Dá para reduzir custo ainda mais? → Use Veo3 Fast, limite para 2 cenas, diminua duração e imagens em baixa variação.

Como garantir consistência de marca? → Traga foto bem iluminada, close do rótulo, peça no prompt: preservar logo, cores HEX e tipografia detectadas.

usar 16:9; para vertical, 9:16.

Exemplo de saída esperada { "cenas":[ { "prompt_imagem":"Foto amadora, luz de janela, pessoa segurando o produto…", "prompt_video":"Vídeo curto estilo selfie; diálogo: '{{dialogo}}' …", "aspect_ratio_imagem":"2:3", "aspect_ratio_video":"9:16", "modelo_video":"veo-3-fast" }, ... ] }

KIE AI – criação e polling⌗

Observação: os endpoints/nome de campos podem variar. Use a documentação atual da KIE AI. Abaixo um esqueleto genérico.

Criar imagem (HTTP Request) POST https://api.kie.ai/v1/image/edit Body JSON: { "image_url": "{{image_url_publica}}", "prompt": "{{ \$json.prompt_imagem }}", "aspect_ratio": "{{ \$json.aspect_ratio_imagem }}", "num_variants": 1 } Headers: Authorization: Bearer {{KIE_API_KEY}}

Consultar status da imagem GET https://api.kie.ai/v1/image/tasks/{{task_id}} Resposta inclui success_flag e result_url

Criar vídeo Veo3 Fast POST https://api.kie.ai/v1/video/generate Body JSON: { "model": "{{ \$json.modelo_video }}", "prompt": "{{ \$json.prompt_video }}", "aspect_ratio": "{{ \$json.aspect_ratio_video }}", "image_url": "{{result_url_da_imagem}}" }

Consultar status do vídeo GET https://api.kie.ai/v1/video/tasks/{{task_id}} Resposta inclui success_flag e video_url (.mp4)

Evolution API – envio no WhatsApp⌗

Enviar imagem POST https\://{{host}}/message/image { "number": "{{whatsapp_sem_+}}", "image": "{{result_url_da_imagem}}", "caption": "Prévia UGC" }

Enviar texto com link do vídeo POST https\://{{host}}/message/text { "number": "{{whatsapp_sem_+}}", "text": "Seu vídeo UGC: {{video_url}}" }

Dica: se quiser enviar o arquivo diretamente e sua instância suportar bem vídeo, use o endpoint de vídeo; caso contrário, enviar o link é mais confiável.

Duplicando cenas em paralelo (Split Out)⌗

No n8n, após a saída JSON do agente:

Use Split Out em \$.cenas
Cada ramo recebe uma cena completa para processar imagem e vídeo separadamente
Faça o laço de polling com Wait + HTTP status + IF success_flag

Versões de aspecto⌗

Vertical: 9:16 Horizontal: 16:9 (atende sua preferência) Fotos para e-commerce: 2:3 também é bom para carrosséis

Exemplo de solicitacoes_especiais⌗

faixa etária 25–40; roupa casual; cenários: sala com luz de janela; mesa de café com notebook; rua movimentada à luz do dia; carro estacionado; proibir colocar o produto na cabeça; mostrar embalagem com logo visível; manter cores HEX da análise; plano próximo da mão.

Custos práticos⌗

Regra do vídeo: 1 imagem + 1 vídeo ≈ €0,46 com Veo3 Fast Com €2: 4 imagens + 4 vídeos

Variação opcional: 1 ator, 4 cenas, vídeo único \~32s⌗

Em vez de 4 atores/cenas independentes:

No agente, peça 4 cenas sequenciais com o mesmo ator e coerência de ambiente
Gere 4 clipes de 8s e una em 1 vídeo
União: se seu n8n permitir Execute Command com ffmpeg local, concatene; senão, suba os 4 clipes a um serviço de join ou peça à KIE AI um job longo (se disponível)

Erros comuns e como evitar⌗

Produto alterado na cena → Especifique claramente: não alterar forma/uso; exibir apenas em mão/mesa; reforçar cores HEX e logotipo.

Link do Drive inacessível → Garanta Share File como Anyone/Reader e use o padrão uc?export=download\&id=FILE_ID.

Vídeo não chega no WhatsApp → Prefira enviar o link do MP4 hospedado ou primeiro subir ao Drive e mandar o link.

Loop infinito no polling → Use IF success_flag==1, com limite de tentativas e backoff (ex.: Wait 10s e máximo de 80 ciclos).

Checklist final⌗

Webhook recebendo todos os campos Upload + Share no Drive funcionando image_url pública montada Vision retornando Markdown com marca/HEX/fonte/decisões Agente JSON entregando 4 cenas válidas Split Out ativo KIE AI imagem: criar → poll → success_flag → result_url Enviar imagem no WhatsApp KIE AI vídeo: criar → poll → success_flag → video_url Enviar link do vídeo no WhatsApp Logs limpos e variáveis nomeadas

Perguntas rápi⌗

Segue um passo a passo prático para você replicar a automação UGC no n8n, com prompts prontos, estrutura de nós, exemplos e checklist final.

Visão geral rápida Passo a Passo⌗

Entrada: formulário com dados + 1 foto do produto Processo: extrai info visual da foto → gera prompts de imagem e vídeo → cria imagens e vídeos → envia no WhatsApp Saída: 4 imagens + 4 vídeos UGC realistas prontos para postar

Pré-requisitos⌗

n8n (self-hosted ou cloud)
Conta OpenAI com acesso ao GPT-4o (Vision) e GPT-4.1
Conta KIE AI com créditos (crie API key)
Google Drive com credenciais no n8n
Evolution API (instância ativa) para WhatsApp
Formulário (Google Forms ou Typeform) apontando para um Webhook do n8n

Estrutura do workflow no n8n (visão de alto nível)⌗

Webhook Trigger → recebe dados do formulário e arquivo/imagem
Google Drive: Upload File → pega o fileId
Google Drive: Share File (Anyone with link, Reader) → torna público
Set/Function → monta a image_url pública do Drive
OpenAI: Vision Analyze → extrai marca, paleta HEX, fonte e elementos
OpenAI: Agent JSON (GPT-4.1) → gera JSON com 4 cenas (prompts de imagem e vídeo)
Split Out → separa cenas em paralelo (1, 2, 3, 4)
Para cada cena: 8.1) HTTP Req KIE AI: Create Image (edit com image_url + prompt) 8.2) Wait 5s → HTTP Req KIE AI: Get Image Details → IF success_flag==1 senão loop 8.3) Evolution API: Send Image (WhatsApp) 8.4) HTTP Req KIE AI: Create Video Veo3 Fast (prompt de vídeo + image_url) 8.5) Wait 10s → HTTP Req KIE AI: Get Video Details → IF success_flag==1 senão loop 8.6) (Opcional) HTTP GET binário do MP4 → Google Drive: Upload File 8.7) Evolution API: Send Text (link do vídeo) ou Send Video
Done

Campos do formulário sugeridos⌗

numero_videos: 4 dialogo: texto curto e natural do ator modelo_video: Veo3 Fast ou Veo3 formato_video: vertical 9:16 ou horizontal 16:9 solicitacoes_especiais: lista livre de cenas/locações, faixa etária, estilo, restrições imagem_produto: upload de arquivo whatsapp: número com DDI (ex: +55DDDNUMERO)

Montando a URL pública da imagem (Drive)⌗

Após Upload File e Share File, construa: https://drive.google.com/uc?export=download\&id=FILE_ID

Prompt para análise de imagem (OpenAI Vision – mensagem do usuário)⌗

Analise a imagem fornecida e retorne exclusivamente um bloco Markdown com: Marca: \ Paleta HEX: [ {hex: #FFFFFF, nome: branco-neutro, onde: embalagem/rotulo…}, … ] Fonte/estilo tipográfico: \ Decisões visuais: lista curta dos elementos-chave visíveis Foque apenas no produto principal, ignore o restante. Não inclua comentários fora do bloco Markdown.

Entrada de mídia: image_url pública do Drive

Agente para gerar prompts JSON (OpenAI GPT-4.1)⌗

Mensagem do sistema Você é um gerador de prompts UGC realistas. Regras:

Estilo amador, luz natural, micro imperfeições de enquadramento.
Evite parecer IA. Tentar variação de atores/cenas cotidianas.
Se faltar diálogo, crie um de até 200 caracteres, natural e coloquial.
Respeite fielmente a marca, cores (HEX), tipografia e elementos detectados.
Se o produto não deve ser usado no corpo, diga claramente para só exibir na mão/mesa/ambiente.
Saída estritamente em JSON válido.

Mensagem do usuário (template) Gere N cenas independentes com esta estrutura: { "cenas": [ { "prompt_imagem": "...", "prompt_video": "...", "aspect_ratio_imagem": "2:3 ou 16:9", "aspect_ratio_video": "9:16 ou 16:9", "modelo_video": "veo-3-fast" } ] } Parâmetros:

N = {{numero_videos}}
Dialogo base: {{dialogo}}
Formato desejado: {{formato_video}}
Modelo vídeo: {{modelo_video}}
Restrições/pedidos: {{solicitacoes_especiais}}
Análise Visual Markdown da imagem: {{saida_vision}} Instruções adicionais:
Manter produto idêntico ao da foto (cores/rotulagem/forma).
Se for faixa/cinta: não colocar na cabeça; apenas segurar/mostrar.
Em cada cena, variar local/ator/detalhes de fundo mantendo coerência de marca.
Para horizontal,

Resumo geral⌗

O vídeo ensina como criar automaticamente atores virtuais com inteligência artificial para gerar conteúdo UGC (User Generated Content). O sistema utiliza formulários, análise de imagens, prompts de IA e ferramentas de automação para produzir imagens e vídeos realistas de produtos sendo apresentados por atores virtuais, entregues diretamente pelo WhatsApp.

Principais etapas do processo⌗

Entrada de dados via formulário

Número de vídeos desejados.
Texto do diálogo (o que o ator deve dizer).
Modelo de IA (Veo3 ou Veo3 Fast).
Formato do vídeo (vertical ou horizontal).
Solicitações especiais (ex: cenário, idade dos atores).
Imagem do produto.
Número de WhatsApp para envio.

Upload da imagem do produto

Envio ao Google Drive.
Tornar o arquivo público para que a IA consiga acessar via URL.

Análise da imagem com GPT-4 Vision

Identificação da marca, paleta de cores (códigos hex), fonte e elementos visuais.
O foco é apenas no produto principal.

Geração de prompts com agente de IA (GPT-4.1)

Criação de prompts separados para imagem e vídeo.
Definição de aspecto (ex: 9:16).
Inserção de diálogos, estilos e detalhes realistas.
Estrutura de saída em JSON para facilitar automação.

Divisão em cenas

O prompt gera múltiplas cenas.
O fluxo divide cada cena para processamento paralelo.

Criação de imagens (kie.ai)

Geração de imagens realistas com base no produto e prompt.
Loop de espera com “success flag” até a imagem ser concluída.
Retorno com URL final da imagem.

Envio de imagens pelo WhatsApp (Evolution API)

Envio automático das imagens geradas ao número indicado.

Criação de vídeos (kie.ai + Veo3 Fast)

Uso do prompt de vídeo, imagem gerada e parâmetros (modelo e aspecto).
Loop de espera até a conclusão do vídeo.
Download do vídeo em MP4.

Envio de vídeos pelo WhatsApp

Envio do link ou arquivo de vídeo finalizado diretamente ao usuário.

Exemplos mostrados⌗

Produtos reais (garrafas térmicas, manteiga de amendoim, faixa Muse2 para meditação).
Imagens geradas colocando o produto em diferentes contextos.
Vídeos curtos (8 segundos) com falas realistas dos atores virtuais.

Custos aproximados⌗

Cada ciclo de 1 imagem + 1 vídeo ≈ 0,46 € (usando Veo3 Fast).
Com 2 € é possível gerar 4 vídeos + 4 imagens.

Dicas e melhorias⌗

Especificar no prompt para não alterar a função do produto (ex: não colocar a faixa na cabeça quando não é necessário).
Usar diálogos naturais, curtos e espontâneos.
Criar vídeos longos combinando várias cenas do mesmo ator (em vez de quatro vídeos diferentes).
Manter estilo “amador” para reforçar autenticidade do UGC.

e40. Gera UGC automático com IA

🌟 RESUMO ESTRUTURADO DA AULA

🌟 Objetivo da aula Aprender a gerar conteúdo estilo UGC (User Generated Content) de forma totalmente automatizada utilizando IA. Nesta aula criamos um sistema que, a partir de um formulário, gera imagens e vídeos realistas de atores promovendo um produto, usando apenas uma foto simples e algumas instruções.

💪 O que conseguimos com esta automação?

Criar atores virtuais que promovem seu produto ou serviço.
Gerar vídeos estilo UGC com diferentes cenas e pessoas.
Automatizar tudo a partir de um formulário: imagem, roteiro e cena.
Receber as imagens e vídeos diretamente pelo WhatsApp.
Reduzir ao mínimo os custos de produção de conteúdo publicitário.

🧩 Estrutura do fluxo automatizado

Recebimento do formulário

Coleta de dados como: número de vídeos, diálogo, modelo de IA, formato, pedidos especiais, imagem do produto e WhatsApp.

Upload e compartilhamento da imagem no Google Drive

O arquivo é carregado, tornado público e o link acessível é obtido para a IA.

Análise da imagem com GPT-4 Vision

Extração de informações visuais principais: marca, cores, fonte e elementos.

Geração do prompt com agente IA (GPT-4.1)

Estruturação de prompts detalhados para criar:
- Prompt de imagem
- Prompt de vídeo
- Relação de aspecto
- Modelo de geração (Veo3 Fast)

Divisão em cenas individuais

Separação das saídas para trabalhar em paralelo.

Criação de imagens com kie.ai

Cada imagem é gerada a partir do prompt e da imagem original.
Aguardando até que a geração seja concluída.
Obtenção da URL final da imagem.

Envio de imagens pelo WhatsApp (Evolution API)

As imagens são enviadas automaticamente via WhatsApp Web automatizado.

Geração de vídeos com Veo3 Fast (kie.ai)

O vídeo é gerado usando prompt, imagem e modelo selecionado.
Loop até a confirmação de finalização.
Download do vídeo.

Envio de vídeos pelo WhatsApp

O link do vídeo gerado é enviado diretamente ao usuário.

🧰 Ferramentas utilizadas

N8N
OpenAI GPT-4o e Vision
kie.ai (Veo3, Imagem e Vídeo)
Google Drive
Google Forms (ou Typeform)
Evolution API (WhatsApp Web)

🧠 Conselhos-chave que aprendemos

Use prompts realistas: estilo amador, luz natural, espontaneidade.
Garanta o compartilhamento correto das URLs da imagem para acesso da IA.
Dividir as saídas do agente facilita o trabalho em paralelo.
Automatize o loop de espera com "success flag" para não travar o processo.
É possível combinar várias cenas com o mesmo ator e criar um vídeo longo.
Com apenas 2 euros é possível criar 4 vídeos + 4 imagens.
Ideal para marcas que desejam escalar UGC sem gravações reais.

Resources

Blueprint UGC
KIE AI
KIE AI API

Gere vídeos UGC automáticos com IA 🔥🔥🔥 ISSO É TOP!!

Isso vai explodir sua mente 🚀

Deixo exemplos de vídeos e imagens anexados 😎

Nesta aula montamos uma automação que, a partir de uma foto e um formulário, gera imagens e vídeos estilo UGC com atores de IA que promovem o seu produto.

🤝 Tudo 100% realista, natural e sem gravar nada.

Isso é o que faz:

✅ Extrai informações visuais do seu produto (marca, cores, design).
✅ Gera prompts para criar cenas fotorrealistas.
✅ Cria vídeos automáticos com atores virtuais.
✅ Envia tudo pelo WhatsApp pronto para publicar.

Usamos o melhor do GPT-4 Vision, Kie.ai, N8N e Evolution API. É baratíssimo de executar e permite escalar conteúdo sem produção.

Você pode aplicar isso se for uma marca de produto, ecommerce, agência ou se vende pelas redes.

docs.kie.ai ↗

kie.ai/dashboard ↗

kie.ai ↗

e40 - UGC Videos Automaticos

chatgpt.com ↗