cerebro-vip INEMA.CLUB
inícioINEMA.VOZ

Documentação e execução do script `dublar31.py`, um dublador…

INEMA.VOZ · 2025-09-11 · ~3 min · ver no Telegram ↗

INEMA

(voz-bark) PS C:\Users\neima\voz_teste> python dublar31.py --in ccode-dia10.mp4 --src en --tgt pt --tts bark --voice v2/pt_speaker_1 --sync smart --tolerance 0.0 --maxstretch 2.0

Se você já usa conda e os pacotes estão instalados, então é ainda mais simples.

Depois de reiniciar o PC, basta reativar o ambiente certo no PowerShell antes de rodar o script.

Passos no PowerShell

  1. Abrir o PowerShell Pode ser normal ou PowerShell Core, tanto faz.

  2. Ativar o ambiente conda Se o nome do ambiente for, por exemplo, voz-bark:

conda activate voz-bark

Se você não lembra o nome, use:

conda env list

Vai aparecer a lista de ambientes disponíveis.

  1. Entrar na pasta do projeto

cd C:\Users\neima\voz_teste

  1. Rodar o script normalmente

python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt ` --tts bark --voice v2/pt_speaker_1 ` --sync smart --tolerance 0.12 --maxstretch 1.4 ` --preserve-gaps --gap-min 0.20 --fade 0.02


Ou seja: só precisa ativar o conda + entrar na pasta antes de rodar o python.

Esse comando tem vários parâmetros, cada um controla uma parte do fluxo do dublador. Vou detalhar:

Entrada e Saída

--in ccode-dia6.mp4 Arquivo de vídeo de entrada.

--src en Idioma original (source), aqui inglês.

--tgt pt Idioma de destino (target), aqui português.

--tts bark Escolhe o motor de TTS (texto-para-fala). Pode ser bark (mais natural, mas pesado) ou coqui.

--voice v2/pt_speaker_1 Voz específica a ser usada pelo Bark ou Coqui (quando suportado).


Sincronização

--sync smart Modo de sincronização:

  • none = não ajusta tempo.
  • fit = força cada trecho a caber exatamente.
  • pad = só completa com silêncio ou corta.
  • smart = mistura: se o áudio for menor, completa silêncio; se for maior, comprime.

--tolerance 0.12 Margem de tolerância (12%). Se a diferença entre tempo real e tempo alvo for menor que isso, não aplica compressão/esticamento (só corta ou preenche silêncio).

--maxstretch 1.4 Limite máximo de aceleração ou desaceleração. Aqui permite até 40% de diferença na velocidade. Evita vozes muito distorcidas.


Pausas e Silêncios

--preserve-gaps Mantém pausas reais entre segmentos. Se no vídeo original um trecho termina em 12:10 e o próximo só começa em 12:20, o script insere um silêncio de 10 s.

--gap-min 0.20 Só insere silêncio se o buraco for maior que 0,20 segundos. Evita gerar dezenas de micro-arquivos de silêncio.


Pós-processamento de áudio

--fade 0.02 Aplica micro fade-in e fade-out de 0,02 segundos em cada trecho, para não dar estalos nas emendas. Se usar 0, desativa.


Em resumo

  • O vídeo é traduzido e dublado em português.
  • Usa a voz pt_speaker_1 com Bark.
  • Sincronização inteligente, com tolerância de 12% e no máximo 40% de compressão/aceleração.
  • Mantém pausas reais do original, mas só se forem maiores que 0,20s.
  • Aplica micro-fades de 0,02s em cada corte.

O que mudou na prática

Fator de velocidade certo para comprimir trechos longos sem “espichar” a fala: ratio = cur/target.

Fade configurável: --fade usa exatamente o valor passado; se 0, desativa.

Silêncio entre segmentos respeitando timestamps quando há gap real, via --preserve-gaps e --gap-min.

Saída automática em dublado/ com o mesmo nome do vídeo de entrada se você não passar --out.

Indentação e blocos dentro do main organizados para evitar erros.

python dublar31.py --in ccode-dia6.mp4 --src en --tgt pt \ --tts bark --voice v2/pt_speaker_1 \ --sync smart --tolerance 0.12 --maxstretch 1.4 \ --preserve-gaps --gap-min 0.20 --fade 0.02

Dublar v31

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗