Levantamento de soluções open-source para dublagem automática de…

INEMA

Para dublar vídeos técnicos de computador (em inglês) para português, você precisa de uma solução que garanta:

Reconhecimento preciso do inglês técnico (STT)
Tradução fiel para português, sem perder termos técnicos
Geração de voz natural em português
Sincronização com o vídeo para não ficar fora de tempo

Melhor caminho open-source para o seu caso⌗

1. Open Dubbing⌗

Já integra Whisper (STT), tradução (NLLB ou MarianMT), TTS (Coqui ou outros) e sincronização.
Ideal para começar rápido e rodar localmente.
Link: https://github.com/Softcatala/open-dubbing

2. Linly-Dubbing⌗

Traz interface Web fácil de usar.
Faz separação de voz, tradução com modelos grandes (ex.: Qwen, GPT), clonagem de voz (CosyVoice), e sincronização labial.
Bom se você quiser um resultado mais profissional e visual.
Link: https://github.com/Kedreamix/Linly-Dubbing

3. ViDubb⌗

Se quiser que os vídeos fiquem mais “realistas”, com lip-sync, preservando até sons de fundo.
Ideal se o treinamento for em vídeo com instrutor aparecendo.
Link: https://github.com/medahmedkrichen/ViDubb

Fluxo recomendado para treinamentos técnicos⌗

Transcrição (STT): Whisper ou WhisperX para pegar bem os termos técnicos.
Tradução: NLLB-200 ou MarianMT → boas opções para inglês → português mantendo contexto técnico.
TTS: Coqui TTS ou CosyVoice para gerar a voz em português natural.
Sincronização: Aeneas ou os próprios módulos de Open Dubbing/Linly/ViDubb.

Aqui está a lista apenas com os links diretos dos projetos de dublagem open-source:

Open Dubbing: https://github.com/Softcatala/open-dubbing
Speech-to-Speech (Hugging Face): https://github.com/huggingface/speech-to-speech
ViDubb: https://github.com/medahmedkrichen/ViDubb
Dubbie: https://github.com/DubbieHQ/dubbie
Linly-Dubbing: https://github.com/Kedreamix/Linly-Dubbing
VideoDubber: https://github.com/am-sokolov/videodubber
SoniTranslate: https://github.com/R3gm/SoniTranslate

Soluções prontas, open-source, para dublagem automática (também chamada de speech-to-speech dubbing)—ou seja, ferramentas integradas onde os passos de transcrição, tradução, clonagem de voz e sincronização com vídeo já estão estruturados. Aqui estão algumas opções robustas e prontamente utilizáveis:

Soluções open-source prontas para dublagem⌗

1. Open Dubbing (Softcatala)⌗

Ferramenta de linha de comando que engloba STT (Whisper), tradução (ex: NLLB), TTS (Coqui, MMS, Edge, OpenAI), detecção de gênero e sincronização de áudio com vídeo ([GitHub][1]).
Funciona localmente e vem com documentação clara e exemplos.
Ideal para automatizar traduções de vídeos com modelos open-source integrados.

2. Speech-to-Speech (Hugging Face)⌗

Pipeline modular que inclui Voice Activity Detection (VAD), STT, modelo de linguagem (LM) e TTS, com infraestrutura flexível para execução local ou via servidor ([GitHub][2]).
Permite customizar cada etapa com modelos do Hugging Face — excelente se quiser construir seu próprio fluxo com componentes ajustáveis.

3. ViDubb⌗

Plataforma avançada para dublagem de vídeo com suporte a clone de voz com emoção, sincronização labial (lip-sync), preservação de som ambiente, diarização de falantes, interface web via Gradio e funcionalidade para rodar em CPU/GPU ([GitHub][3]).
Perfeita para criar vídeos dublados realistas com fluidez e controle visual.

4. Dubbie⌗

Estúdio de dublagem open-source, construído com Next.js, visando oferecer uma solução completa com interface web. Custos estimados de apenas US\$ 0.1/min, muito mais barato que soluções comerciais ([GitHub][4]).
Ainda em desenvolvimento, mas já útil para projetos práticos com interface amigável.

5. Linly-Dubbing⌗

Ferramenta inspirada no YouDub-webui, com WebUI intuitiva, downloads automáticos de vídeo, separação de voz (Demucs, UVR5), reconhecimento de fala (WhisperX, FunASR), tradução com grande modelo (ex: GPT, Qwen), clonagem de voz (CosyVoice, GPT-SoVITS), sincronia labial e interface de fácil uso ([GitHub][5]).

6. Outros projetos interessantes⌗

VideoDubber (am-sokolov): script Python para extrair áudio, transcrever (Whisper), traduzir (Google Translate), gerar novo áudio (Google TTS) e recombinar com o vídeo ([GitHub][6]).
SonyTranslate (SoniTranslate): aplicativo web com UI via Gradio para traduzir vídeos com áudio sincronizado ([GitHub][7]).

Qual escolher?⌗

Quer algo que funcione já agora, localmente? → Open Dubbing é ótimo, direto ao ponto, e usa frameworks reconhecidos.
Quer personalizar intensamente? → Speech-to-Speech pipeline da HF oferece flexibilidade máxima.
Precisa de visual de alta qualidade, sincronização labial, web interface? → Vá com ViDubb ou Linly-Dubbing.
Prefere uma solução web mais leve com rapidez de uso? → Considere Dubbie ou SoniTranslate, dependendo do nível de maturidade que busca.

soluções prontas de dublagem open-source, já integradas ou quase prontas para rodar. Aqui estão algumas opções consolidadas:

1. Rask AI (versão open-source limitada pela comunidade)⌗

Há forks não-oficiais no GitHub que usam Whisper + TTS.
Faz tradução + dublagem com sincronização básica.

2. OpenVoice (Bytedance, open-source no GitHub)⌗

Ferramenta de voice cloning cross-lingual.
Permite falar em outros idiomas mantendo o timbre original.
Já vem com exemplos prontos para dublagem.

3. Sovits + OpenVPI Toolkit⌗

Projeto chinês muito usado para dublagem.
Clona voz, traduz e dublagem é feita quase automática.
Precisa baixar os modelos treinados (comunidade já distribui).

4. Whisper + Coqui TTS + Aeneas (pacote pronto)⌗

Existem repositórios no GitHub que já trazem o pipeline fechado:
Whisper → traduz → gera áudio no Coqui → sincroniza com Aeneas.
Solução prática, com scripts prontos para vídeo.

5. Fairseq S2T (Speech-to-Speech Translation)⌗

Da Meta, já vem com suporte para entrada voz e saída voz.
Menos plug-and-play que OpenVoice, mas funciona bem para dublagem multilíngue.

6. OpenDubber (comunidade GitHub)⌗

Solução específica para dublagem automática.
Usa Whisper + VITS ou Coqui.
Já entrega vídeo final sincronizado.

Ou seja:

Se quiser simples e direto → OpenVoice.
Se quiser completo e customizável → Whisper + Coqui + Aeneas (pacote GitHub).
Se quiser voz parecida com a original em outro idioma → Sovits ou VALL-E X (versões open).

Soluções de Dublagem

chatgpt.com ↗

Levantamento de soluções open-source para dublagem automática de…

Melhor caminho open-source para o seu caso⌗

1. Open Dubbing⌗

2. Linly-Dubbing⌗

3. ViDubb⌗

Fluxo recomendado para treinamentos técnicos⌗

Soluções open-source prontas para dublagem⌗

1. Open Dubbing (Softcatala)⌗

2. Speech-to-Speech (Hugging Face)⌗

3. ViDubb⌗

4. Dubbie⌗

5. Linly-Dubbing⌗

6. Outros projetos interessantes⌗

Qual escolher?⌗

1. Rask AI (versão open-source limitada pela comunidade)⌗

2. OpenVoice (Bytedance, open-source no GitHub)⌗

3. Sovits + OpenVPI Toolkit⌗

4. Whisper + Coqui TTS + Aeneas (pacote pronto)⌗

5. Fairseq S2T (Speech-to-Speech Translation)⌗

6. OpenDubber (comunidade GitHub)⌗

Recursos