Guia completo para instalar e rodar o HuMo AI (modelo de geração de…
INEMA
De forma simples e direta:
🟩 O que são os “pesos” (weights) de um modelo de IA?⌗
São os arquivos que contêm o “conhecimento” aprendido pelo modelo.
Ou seja:
- 👉 Os pesos são o cérebro do modelo.
- 👉 Sem eles, o modelo não sabe fazer nada.
📌 Comparação simples:⌗
- O código do modelo = a máquina
- Os pesos = a memória treinada que diz como a máquina deve agir
- Sem pesos = máquina vazia, sem inteligência
- Com pesos = modelo funcionando
📦 Na prática:⌗
Os pesos são arquivos grandes como:
model.safetensors
pytorch_model.bin
checkpoint/
O HuMo AI, por exemplo, tem vários pesos (GBs). Eles contêm:
- como desenhar rostos
- como animar movimentos
- como entender texto
- como gerar vídeo
- como sincronizar lábios
🎯 Resumo simples:⌗
Pesos = conhecimento aprendido do modelo. Sem eles, o modelo não funciona.
Sim — o HuMo AI consegue gerar vídeo a partir de foto + texto, e também foto + áudio.
Aqui vai a forma simples e direta, como você pediu:
🟩 1) Entrar no container⌗
docker start humo_container
docker exec -it humo_container bash
🟦 2) Ir para a pasta do HuMo⌗
cd /workspace/HuMo
🟧 3) Gerar VÍDEO usando FOTO + TEXTO⌗
Comando:⌗
python demo/imgtxt2video.py \
--ref_image images/minha_foto.png \
--prompt "a pessoa está sorrindo e mexendo a cabeça" \
--output_path /workspace/HuMo/data/video_foto_texto.mp4
❗ O que você precisa fazer antes:⌗
✔️ Coloque sua foto dentro do container em:⌗
/workspace/HuMo/images/
Ou, no host, coloque em:
~/projetos/HuMo/data/images
(a pasta está montada, depende do seu setup)
Se quiser criar a pasta:
mkdir -p /workspace/HuMo/images
E copiar para lá.
🟪 4) Gerar VÍDEO usando FOTO + ÁUDIO (lipsync)⌗
Se você tiver uma foto e uma gravação de voz:
python demo/av2video.py \
--ref_image images/minha_foto.png \
--audio audio/minha_voz.wav \
--output_path /workspace/HuMo/data/video_foto_audio.mp4
🟢 Onde o vídeo final aparece?⌗
No host:
~/projetos/HuMo/data/
Se quiser, posso te ajudar a:
- criar a pasta certa para a foto,
- copiar sua foto para dentro do container,
- gerar um comando pronto com sua imagem.
Só me mandar:
o nome do arquivo da foto.
Claro. Aqui vai a forma mais simples e direta possível, sem enrolação:
✅ 1. Entrar no container⌗
Primeiro, iniciar (caso esteja parado):
docker start humo_container
Depois, entrar:
docker exec -it humo_container bash
Pronto. Você está dentro.
✅ 2. Rodar um vídeo (dentro do container)⌗
Texto → vídeo:
```cd /workspace/HuMo
python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```
🟢 Onde o vídeo fica?⌗
No host:
~/projetos/HuMo/data/video1.mp4
🎯 Resumo curtíssimo:⌗
docker start humo_container
docker exec -it humo_container bash
cd /workspace/HuMo
python demo/txt2video.py --prompt "texto aqui" --output_path /workspace/HuMo/data/video.mp4
Pronto. Isso é tudo que você precisa para entrar e gerar um vídeo.
🟩 1) PROCEDIMENTOS PARA ENTRAR NO DOCKER PELA PRIMEIRA VEZ E O QUE FAZER LÁ DENTRO⌗
✅ 1.1 — Criar o container (uma única vez)⌗
No host (fora do container), dentro da pasta do projeto:
docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
-it --name humo_container \
-v $(pwd)/data:/workspace/HuMo/data \
humoai bash
👉 Esse comando cria o container e já entra nele.
✅ 1.2 — Dentro do container, você deve fazer apenas isso:⌗
A) Verificar se a GPU está funcionando⌗
nvidia-smi
B) Logar no HuggingFace⌗
huggingface-cli login
Cole seu token e confirme.
C) Baixar os modelos do HuMo AI⌗
```cd /workspace/HuMo rm -rf checkpoints mkdir checkpoints
huggingface-cli download bytedance-research/HuMo \ --local-dir checkpoints \ --local-dir-use-symlinks False```
D) Confirmar que os arquivos baixaram⌗
ls -lh checkpoints
👉 Pronto. Depois disso o ambiente interno está preparado.
🟦 2) PROCEDIMENTOS PARA ENTRAR NO DOCKER DEPOIS E RODAR OS VÍDEOS⌗
Depois que o container já existe, você NÃO cria ele de novo.
Você apenas entra nele.
✅ 2.1 — Iniciar o container (se estiver parado)⌗
docker start humo_container
✅ 2.2 — Entrar no container⌗
docker exec -it humo_container bash
Agora você está lá dentro.
🟧 3) RODAR OS VÍDEOS (DENTRO DO CONTAINER)⌗
3.1 — Teste de geração de vídeo por texto⌗
```cd /workspace/HuMo
python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```
3.2 — Teste imagem + texto⌗
python demo/imgtxt2video.py \
--ref_image images/teste.png \
--prompt "falando e sorrindo" \
--output_path /workspace/HuMo/data/video_img.mp4
3.3 — Teste áudio + imagem (lipsync)⌗
python demo/av2video.py \
--ref_image images/teste.png \
--audio audio/voz.wav \
--output_path /workspace/HuMo/data/video_audio.mp4
🟪 4) Onde ficam os vídeos gerados?⌗
Fora do container, no host:
~/projetos/HuMo/data
Porque montamos essa pasta com:
-v $(pwd)/data:/workspace/HuMo/data
🟩 RESUMÃO RÁPIDO⌗
Entrar a primeira vez + baixar modelo⌗
docker run --gpus all ... humoai bash
huggingface-cli login
huggingface-cli download ...
Entrar depois⌗
docker start humo_container
docker exec -it humo_container bash
Gerar vídeo⌗
python demo/txt2video.py ...
dentro do docker
o dockerfile1 nao funcionou[
HuggingFace:
Dentro do container:
cd /workspace/HuMo
rm -rf checkpoints
mkdir checkpoints
huggingface-cli download bytedance-research/HuMo \
--local-dir checkpoints \
--local-dir-use-symlinks False
Isso baixa com barra de progresso e não trava.
📘 11. Confirmar arquivos baixados⌗
ls -lh checkpoints
Deve ter arquivos .safetensors grandes (1–4 GB cada).
📘 12. Rodar o PRIMEIRO teste⌗
python demo/txt2video.py \
--prompt "uma pessoa sorrindo e acenando" \
--output_path output.mp4
Se gerar sem erro → parabéns, o HuMo está rodando no seu DGX.
📘 13. Conferir o vídeo⌗
No host:
ls -lh ~/projetos/HuMo/data
Ou copie para sua máquina:
scp DGX:/home/.../output.mp4 .
🟩 14. O QUE VOCÊ TEM AGORA⌗
Você tem:
- Docker funcionando
- Container GPU-aware
- Imagem PyTorch Blackwell
- HuMo AI instalado
- Modelos baixados
- Geração de vídeo funcionando
📘 15. Se quiser, posso gerar um PDF ou Markdown com tudo isso formatado.⌗
Pergunta: 🟦 Quer o documento final em:
- Markdown (.md)
- Ambos
Só responder com 1, 2 ou 3.
Perfeito. Agora vou entregar o GUIA COMPLETO — ABSOLUTAMENTE DO ZERO, como se você estivesse configurando um DGX Spark recém-instalado, sem nada pronto.
Este guia será didático, organizado, sem pular etapas, sem atalhos, e explicando tudo.
🟩 GUIA DEFINITIVO — Instalar e Rodar HuMo AI no DGX Spark (GPU GB10)⌗
(Do zero absoluto → até gerar o primeiro vídeo)⌗
📘 1. Entender a arquitetura do seu DGX Spark⌗
Seu DGX Spark possui:
- GPU NVIDIA GB10 (arquitetura Blackwell)
- Driver: 580.95.05
- CUDA: 13.0
- Sistema Linux (Ubuntu Server / Desktop)
Isso importa porque:
- Imagens Docker antigas (CUDA 12.x) não reconhecem GB10
- Você precisa usar imagens CUDA 13+
- PyTorch deve estar compilado para GPU Blackwell
- Modelos grandes (como HuMo AI) precisam de grande VRAM → seu hardware aguenta
➡️ Seu DGX está perfeitamente preparado.
📘 2. Confirmar drivers e CUDA (no host, fora do Docker)⌗
Rode estas linhas:
nvidia-smi
Você tem que ver:
- GPU: NVIDIA GB10
- Driver: 580.xx
- CUDA Version: 13.0
Se isso aparecer → perfeito.
Se der erro → driver está quebrado → precisa reinstalar (posso ensinar, mas no seu caso está OK).
📘 3. Verificar se Docker está instalado⌗
Rode:
docker --version
Se der algo como:
Docker version 24.x.x
→ ok Se der erro, instale:
sudo apt update
sudo apt install docker.io -y
sudo systemctl enable --now docker
sudo usermod -aG docker $USER
📌 IMPORTANTE: Depois de adicionar o usuário ao grupo docker, rode:
newgrp docker
📘 4. Instalar NVIDIA Container Toolkit⌗
Para que o Docker use sua GPU, você precisa disso:
sudo apt install -y nvidia-container-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
Teste:
docker run --rm --gpus all nvidia/cuda:12.3.0-base-ubuntu22.04 nvidia-smi
Se mostrar sua GPU → tudo certo.
📘 5. Criar diretório do projeto⌗
Faça no host:
mkdir -p ~/projetos/HuMo
cd ~/projetos/HuMo
📘 6. Criar Dockerfile (compatível com GPU GB10)⌗
Crie o arquivo:
nano Dockerfile
Cole:
```FROM nvcr.io/nvidia/pytorch:25.01-py3
RUN apt-get update && apt-get install -y \ git \ git-lfs \ ffmpeg \ && rm -rf /var/lib/apt/lists/*
RUN pip install \ accelerate \ diffusers \ transformers==4.40 \ safetensors \ einops \ soundfile \ opencv-python \ imageio[ffmpeg] \ huggingface_hub \ gradio
WORKDIR /workspace RUN git clone github.com/Phantom-video/HuMo.git ↗
WORKDIR /workspace/HuMo RUN git lfs install```
Salvar: CTRL+O, ENTER Saída: CTRL+X
Explicação:
- Imagem PyTorch 25.01 → suporta Blackwell / CUDA 13
- Inclui FFmpeg → evitar erros ao gerar vídeos
- Git LFS → necessário para baixar modelos do HuggingFace
- Instala dependências do HuMo
- Clona o repositório oficial
📘 7. Construir a imagem Docker⌗
No host:
docker build -t humoai .
Isso baixa tudo (pode demorar).
📘 8. Criar container com GPU habilitada⌗
Rodar:
docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
-it --name humo_container \
-v $(pwd)/data:/workspace/HuMo/data \
humoai bash
Se entrar no container → ótimo.
Agora teste a GPU dentro dele:
nvidia-smi
Se aparecer a GB10 → funcionando.
O WARNING pode aparecer, mas se NÃO aparecer erro → está válido.
📘 9. Logar no HuggingFace (dentro do container)⌗
huggingface-cli login
Insira o token.
→ Você está autenticado.
📘 10. BAIXAR O MODELO HU MO (forma correta e segura)⌗
Porque “git clone” parece travar?⌗
Porque:
- Git baixa só os 25 KB do repositório
- Git LFS tenta baixar 8+ GB de arquivos grandes
- E não mostra progresso dependendo da versão
Por isso parece travar no “done”.
A solução correta é:⌗
NÃO USAR git clone. Use o método oficial recomendado pela
1