cerebro-vip INEMA.CLUB
inícioINEMA.VIDEOS

Tópico sobre criação de vídeos com áudio realista no VEO3, com foco…

INEMA.VIDEOS · 2025-06-17 · ~2 min · ver no Telegram ↗

INEMA

chatgpt.com ↗

em ingles sempre

O segredo para gerar vídeo com áudio realista em português brasileiro — especialmente ao usar ferramentas como o Gemini (ou outros como Runway, Pika, Sora, etc. com suporte a narração) — está em três pontos essenciais:


1. Dizer explicitamente que o idioma é "português brasileiro"

  • Isso orienta o modelo a usar a voz, entonação e sotaque corretos.
  • Muitos modelos interpretam o idioma padrão como inglês se você não especificar.

Exemplo no prompt:

"...shouting in Brazilian Portuguese..."


2. Colocar o texto falado entre aspas

  • Isso sinaliza claramente qual é o conteúdo da fala.
  • Modelos que geram vídeo ou voz costumam buscar trechos com aspas para gerar a narração sincronizada.

Exemplo no prompt:

“Fui pego aqui galera já era, se quiser aprender mais segue o Adão.”


3. Usar modelos que suportam áudio ou voz (Text-to-Speech integrado)

  • Gemini, Runway Gen-3 Alpha, Pika Labs (com voz ativada) e outros estão começando a integrar fala sincronizada com lábios e áudio realista.
  • O vídeo fica muito mais imersivo quando o personagem fala exatamente o que está no script, com a emoção indicada.

Extras que fazem diferença:

  • Tons emocionais (ex: "voz desesperada", "com medo", "tranquila", "feliz")
  • Ambiente sonoro (ex: "som ambiente de floresta ao fundo", "leve eco na fala")
  • Expressões faciais e corporais (ex: "olhar preocupado", "voz trêmula", "movimento leve da câmera")

Exemplo de prompt completo com os 3 segredos:

Scene of a Brazilian-looking teenager with curly hair, wearing a school backpack, standing alone at a bus stop at night. He looks scared and whispers in Brazilian Portuguese: “Alguém tá me seguindo… se eu sumir, foi por isso.” His voice sounds low and fearful. There’s rain falling softly, and a single streetlight flickers in the background. Keep the camera close to his face, showing trembling lips and shifting eyes.

Criando Videos com Audio no VEO3

1

Recursos

↑ voltar ao topo · ver no Telegram ↗