Documentação e execução do script `dublar31.py`, um dublador…

INEMA

(voz-bark) PS C:\Users\neima\voz_teste> python dublar31.py --in ccode-dia10.mp4 --src en --tgt pt --tts bark --voice v2/pt_speaker_1 --sync smart --tolerance 0.0 --maxstretch 2.0

Se você já usa conda e os pacotes estão instalados, então é ainda mais simples.

Depois de reiniciar o PC, basta reativar o ambiente certo no PowerShell antes de rodar o script.

Passos no PowerShell⌗

Abrir o PowerShell Pode ser normal ou PowerShell Core, tanto faz.
Ativar o ambiente conda Se o nome do ambiente for, por exemplo, voz-bark:

conda activate voz-bark

Se você não lembra o nome, use:

conda env list

Vai aparecer a lista de ambientes disponíveis.

Entrar na pasta do projeto

cd C:\Users\neima\voz_teste

Rodar o script normalmente

python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt ` --tts bark --voice v2/pt_speaker_1 ` --sync smart --tolerance 0.12 --maxstretch 1.4 ` --preserve-gaps --gap-min 0.20 --fade 0.02

Ou seja: só precisa ativar o conda + entrar na pasta antes de rodar o python.

Esse comando tem vários parâmetros, cada um controla uma parte do fluxo do dublador. Vou detalhar:

Entrada e Saída⌗

--in ccode-dia6.mp4 Arquivo de vídeo de entrada.

--src en Idioma original (source), aqui inglês.

--tgt pt Idioma de destino (target), aqui português.

--tts bark Escolhe o motor de TTS (texto-para-fala). Pode ser bark (mais natural, mas pesado) ou coqui.

--voice v2/pt_speaker_1 Voz específica a ser usada pelo Bark ou Coqui (quando suportado).

Sincronização⌗

--sync smart Modo de sincronização:

none = não ajusta tempo.
fit = força cada trecho a caber exatamente.
pad = só completa com silêncio ou corta.
smart = mistura: se o áudio for menor, completa silêncio; se for maior, comprime.

--tolerance 0.12 Margem de tolerância (12%). Se a diferença entre tempo real e tempo alvo for menor que isso, não aplica compressão/esticamento (só corta ou preenche silêncio).

--maxstretch 1.4 Limite máximo de aceleração ou desaceleração. Aqui permite até 40% de diferença na velocidade. Evita vozes muito distorcidas.

Pausas e Silêncios⌗

--preserve-gaps Mantém pausas reais entre segmentos. Se no vídeo original um trecho termina em 12:10 e o próximo só começa em 12:20, o script insere um silêncio de 10 s.

--gap-min 0.20 Só insere silêncio se o buraco for maior que 0,20 segundos. Evita gerar dezenas de micro-arquivos de silêncio.

Pós-processamento de áudio⌗

--fade 0.02 Aplica micro fade-in e fade-out de 0,02 segundos em cada trecho, para não dar estalos nas emendas. Se usar 0, desativa.

Em resumo⌗

O vídeo é traduzido e dublado em português.
Usa a voz pt_speaker_1 com Bark.
Sincronização inteligente, com tolerância de 12% e no máximo 40% de compressão/aceleração.
Mantém pausas reais do original, mas só se forem maiores que 0,20s.
Aplica micro-fades de 0,02s em cada corte.

O que mudou na prática

Fator de velocidade certo para comprimir trechos longos sem “espichar” a fala: ratio = cur/target.

Fade configurável: --fade usa exatamente o valor passado; se 0, desativa.

Silêncio entre segmentos respeitando timestamps quando há gap real, via --preserve-gaps e --gap-min.

Saída automática em dublado/ com o mesmo nome do vídeo de entrada se você não passar --out.

Indentação e blocos dentro do main organizados para evitar erros.

python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt \ --tts bark --voice v2/pt_speaker_1 \ --sync smart --tolerance 0.12 --maxstretch 1.4 \ --preserve-gaps --gap-min 0.20 --fade 0.02

Dublar v31

chatgpt.com ↗