Documentação e execução do script `dublar31.py`, um dublador…
INEMA
(voz-bark) PS C:\Users\neima\voz_teste> python dublar31.py --in ccode-dia10.mp4 --src en --tgt pt --tts bark --voice v2/pt_speaker_1 --sync smart --tolerance 0.0 --maxstretch 2.0
Se você já usa conda e os pacotes estão instalados, então é ainda mais simples.
Depois de reiniciar o PC, basta reativar o ambiente certo no PowerShell antes de rodar o script.
Passos no PowerShell⌗
-
Abrir o PowerShell Pode ser normal ou PowerShell Core, tanto faz.
-
Ativar o ambiente conda Se o nome do ambiente for, por exemplo,
voz-bark:
conda activate voz-bark
Se você não lembra o nome, use:
conda env list
Vai aparecer a lista de ambientes disponíveis.
- Entrar na pasta do projeto
cd C:\Users\neima\voz_teste
- Rodar o script normalmente
python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt `
--tts bark --voice v2/pt_speaker_1 `
--sync smart --tolerance 0.12 --maxstretch 1.4 `
--preserve-gaps --gap-min 0.20 --fade 0.02
Ou seja: só precisa ativar o conda + entrar na pasta antes de rodar o python.
Esse comando tem vários parâmetros, cada um controla uma parte do fluxo do dublador. Vou detalhar:
Entrada e Saída⌗
--in ccode-dia6.mp4
Arquivo de vídeo de entrada.
--src en
Idioma original (source), aqui inglês.
--tgt pt
Idioma de destino (target), aqui português.
--tts bark
Escolhe o motor de TTS (texto-para-fala). Pode ser bark (mais natural, mas pesado) ou coqui.
--voice v2/pt_speaker_1
Voz específica a ser usada pelo Bark ou Coqui (quando suportado).
Sincronização⌗
--sync smart
Modo de sincronização:
- none = não ajusta tempo.
- fit = força cada trecho a caber exatamente.
- pad = só completa com silêncio ou corta.
- smart = mistura: se o áudio for menor, completa silêncio; se for maior, comprime.
--tolerance 0.12
Margem de tolerância (12%). Se a diferença entre tempo real e tempo alvo for menor que isso, não aplica compressão/esticamento (só corta ou preenche silêncio).
--maxstretch 1.4
Limite máximo de aceleração ou desaceleração. Aqui permite até 40% de diferença na velocidade. Evita vozes muito distorcidas.
Pausas e Silêncios⌗
--preserve-gaps
Mantém pausas reais entre segmentos. Se no vídeo original um trecho termina em 12:10 e o próximo só começa em 12:20, o script insere um silêncio de 10 s.
--gap-min 0.20
Só insere silêncio se o buraco for maior que 0,20 segundos. Evita gerar dezenas de micro-arquivos de silêncio.
Pós-processamento de áudio⌗
--fade 0.02
Aplica micro fade-in e fade-out de 0,02 segundos em cada trecho, para não dar estalos nas emendas. Se usar 0, desativa.
Em resumo⌗
- O vídeo é traduzido e dublado em português.
- Usa a voz
pt_speaker_1com Bark. - Sincronização inteligente, com tolerância de 12% e no máximo 40% de compressão/aceleração.
- Mantém pausas reais do original, mas só se forem maiores que 0,20s.
- Aplica micro-fades de 0,02s em cada corte.
O que mudou na prática
Fator de velocidade certo para comprimir trechos longos sem “espichar” a fala: ratio = cur/target.
Fade configurável: --fade usa exatamente o valor passado; se 0, desativa.
Silêncio entre segmentos respeitando timestamps quando há gap real, via --preserve-gaps e --gap-min.
Saída automática em dublado/ com o mesmo nome do vídeo de entrada se você não passar --out.
Indentação e blocos dentro do main organizados para evitar erros.
python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt \ --tts bark --voice v2/pt_speaker_1 \ --sync smart --tolerance 0.12 --maxstretch 1.4 \ --preserve-gaps --gap-min 0.20 --fade 0.02
Dublar v31
1