Tópico sobre criação de vídeos com áudio realista no VEO3, com foco…
INEMA
em ingles sempre
O segredo para gerar vídeo com áudio realista em português brasileiro — especialmente ao usar ferramentas como o Gemini (ou outros como Runway, Pika, Sora, etc. com suporte a narração) — está em três pontos essenciais:
1. Dizer explicitamente que o idioma é "português brasileiro"⌗
- Isso orienta o modelo a usar a voz, entonação e sotaque corretos.
- Muitos modelos interpretam o idioma padrão como inglês se você não especificar.
Exemplo no prompt:
"...shouting in Brazilian Portuguese..."
2. Colocar o texto falado entre aspas⌗
- Isso sinaliza claramente qual é o conteúdo da fala.
- Modelos que geram vídeo ou voz costumam buscar trechos com aspas para gerar a narração sincronizada.
Exemplo no prompt:
“Fui pego aqui galera já era, se quiser aprender mais segue o Adão.”
3. Usar modelos que suportam áudio ou voz (Text-to-Speech integrado)⌗
- Gemini, Runway Gen-3 Alpha, Pika Labs (com voz ativada) e outros estão começando a integrar fala sincronizada com lábios e áudio realista.
- O vídeo fica muito mais imersivo quando o personagem fala exatamente o que está no script, com a emoção indicada.
Extras que fazem diferença:⌗
- Tons emocionais (ex: "voz desesperada", "com medo", "tranquila", "feliz")
- Ambiente sonoro (ex: "som ambiente de floresta ao fundo", "leve eco na fala")
- Expressões faciais e corporais (ex: "olhar preocupado", "voz trêmula", "movimento leve da câmera")
Exemplo de prompt completo com os 3 segredos:⌗
Scene of a Brazilian-looking teenager with curly hair, wearing a school backpack, standing alone at a bus stop at night. He looks scared and whispers in Brazilian Portuguese: “Alguém tá me seguindo… se eu sumir, foi por isso.” His voice sounds low and fearful. There’s rain falling softly, and a single streetlight flickers in the background. Keep the camera close to his face, showing trembling lips and shifting eyes.
Criando Videos com Audio no VEO3
1