Guia completo para instalar e rodar o HuMo AI (modelo de geração de…

INEMA

De forma simples e direta:

🟩 O que são os “pesos” (weights) de um modelo de IA?⌗

São os arquivos que contêm o “conhecimento” aprendido pelo modelo.

Ou seja:

👉 Os pesos são o cérebro do modelo.
👉 Sem eles, o modelo não sabe fazer nada.

📌 Comparação simples:⌗

O código do modelo = a máquina
Os pesos = a memória treinada que diz como a máquina deve agir
Sem pesos = máquina vazia, sem inteligência
Com pesos = modelo funcionando

📦 Na prática:⌗

Os pesos são arquivos grandes como:

model.safetensors pytorch_model.bin checkpoint/

O HuMo AI, por exemplo, tem vários pesos (GBs). Eles contêm:

como desenhar rostos
como animar movimentos
como entender texto
como gerar vídeo
como sincronizar lábios

🎯 Resumo simples:⌗

Pesos = conhecimento aprendido do modelo. Sem eles, o modelo não funciona.

Sim — o HuMo AI consegue gerar vídeo a partir de foto + texto, e também foto + áudio.

Aqui vai a forma simples e direta, como você pediu:

🟩 1) Entrar no container⌗

docker start humo_container docker exec -it humo_container bash

🟦 2) Ir para a pasta do HuMo⌗

cd /workspace/HuMo

🟧 3) Gerar VÍDEO usando FOTO + TEXTO⌗

Comando:⌗

python demo/imgtxt2video.py \ --ref_image images/minha_foto.png \ --prompt "a pessoa está sorrindo e mexendo a cabeça" \ --output_path /workspace/HuMo/data/video_foto_texto.mp4

❗ O que você precisa fazer antes:⌗

✔️ Coloque sua foto dentro do container em:⌗

/workspace/HuMo/images/

Ou, no host, coloque em:

~/projetos/HuMo/data/images

(a pasta está montada, depende do seu setup)

Se quiser criar a pasta:

mkdir -p /workspace/HuMo/images

E copiar para lá.

🟪 4) Gerar VÍDEO usando FOTO + ÁUDIO (lipsync)⌗

Se você tiver uma foto e uma gravação de voz:

python demo/av2video.py \ --ref_image images/minha_foto.png \ --audio audio/minha_voz.wav \ --output_path /workspace/HuMo/data/video_foto_audio.mp4

🟢 Onde o vídeo final aparece?⌗

No host:

~/projetos/HuMo/data/

Se quiser, posso te ajudar a:

criar a pasta certa para a foto,
copiar sua foto para dentro do container,
gerar um comando pronto com sua imagem.

Só me mandar:

o nome do arquivo da foto.

Claro. Aqui vai a forma mais simples e direta possível, sem enrolação:

✅ 1. Entrar no container⌗

Primeiro, iniciar (caso esteja parado):

docker start humo_container

Depois, entrar:

docker exec -it humo_container bash

Pronto. Você está dentro.

✅ 2. Rodar um vídeo (dentro do container)⌗

Texto → vídeo:

```cd /workspace/HuMo

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```

🟢 Onde o vídeo fica?⌗

No host:

~/projetos/HuMo/data/video1.mp4

🎯 Resumo curtíssimo:⌗

docker start humo_container docker exec -it humo_container bash cd /workspace/HuMo python demo/txt2video.py --prompt "texto aqui" --output_path /workspace/HuMo/data/video.mp4

Pronto. Isso é tudo que você precisa para entrar e gerar um vídeo.

🟩 1) PROCEDIMENTOS PARA ENTRAR NO DOCKER PELA PRIMEIRA VEZ E O QUE FAZER LÁ DENTRO⌗

✅ 1.1 — Criar o container (uma única vez)⌗

No host (fora do container), dentro da pasta do projeto:

docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \ -it --name humo_container \ -v $(pwd)/data:/workspace/HuMo/data \ humoai bash

👉 Esse comando cria o container e já entra nele.

✅ 1.2 — Dentro do container, você deve fazer apenas isso:⌗

A) Verificar se a GPU está funcionando⌗

nvidia-smi

B) Logar no HuggingFace⌗

huggingface-cli login

Cole seu token e confirme.

C) Baixar os modelos do HuMo AI⌗

```cd /workspace/HuMo rm -rf checkpoints mkdir checkpoints

huggingface-cli download bytedance-research/HuMo \ --local-dir checkpoints \ --local-dir-use-symlinks False```

D) Confirmar que os arquivos baixaram⌗

ls -lh checkpoints

👉 Pronto. Depois disso o ambiente interno está preparado.

🟦 2) PROCEDIMENTOS PARA ENTRAR NO DOCKER DEPOIS E RODAR OS VÍDEOS⌗

Depois que o container já existe, você NÃO cria ele de novo.

Você apenas entra nele.

✅ 2.1 — Iniciar o container (se estiver parado)⌗

docker start humo_container

✅ 2.2 — Entrar no container⌗

docker exec -it humo_container bash

Agora você está lá dentro.

🟧 3) RODAR OS VÍDEOS (DENTRO DO CONTAINER)⌗

3.1 — Teste de geração de vídeo por texto⌗

```cd /workspace/HuMo

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```

3.2 — Teste imagem + texto⌗

python demo/imgtxt2video.py \ --ref_image images/teste.png \ --prompt "falando e sorrindo" \ --output_path /workspace/HuMo/data/video_img.mp4

3.3 — Teste áudio + imagem (lipsync)⌗

python demo/av2video.py \ --ref_image images/teste.png \ --audio audio/voz.wav \ --output_path /workspace/HuMo/data/video_audio.mp4

🟪 4) Onde ficam os vídeos gerados?⌗

Fora do container, no host:

~/projetos/HuMo/data

Porque montamos essa pasta com:

-v $(pwd)/data:/workspace/HuMo/data

🟩 RESUMÃO RÁPIDO⌗

Entrar a primeira vez + baixar modelo⌗

docker run --gpus all ... humoai bash huggingface-cli login huggingface-cli download ...

Entrar depois⌗

docker start humo_container docker exec -it humo_container bash

Gerar vídeo⌗

python demo/txt2video.py ...

dentro do docker

o dockerfile1 nao funcionou[

HuggingFace:

Dentro do container:

cd /workspace/HuMo rm -rf checkpoints mkdir checkpoints huggingface-cli download bytedance-research/HuMo \ --local-dir checkpoints \ --local-dir-use-symlinks False

Isso baixa com barra de progresso e não trava.

📘 11. Confirmar arquivos baixados⌗

ls -lh checkpoints

Deve ter arquivos .safetensors grandes (1–4 GB cada).

📘 12. Rodar o PRIMEIRO teste⌗

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path output.mp4

Se gerar sem erro → parabéns, o HuMo está rodando no seu DGX.

📘 13. Conferir o vídeo⌗

No host:

ls -lh ~/projetos/HuMo/data

Ou copie para sua máquina:

scp DGX:/home/.../output.mp4 .

🟩 14. O QUE VOCÊ TEM AGORA⌗

Você tem:

Docker funcionando
Container GPU-aware
Imagem PyTorch Blackwell
HuMo AI instalado
Modelos baixados
Geração de vídeo funcionando

📘 15. Se quiser, posso gerar um PDF ou Markdown com tudo isso formatado.⌗

Pergunta: 🟦 Quer o documento final em:

Markdown (.md)
PDF
Ambos

Só responder com 1, 2 ou 3.

Perfeito. Agora vou entregar o GUIA COMPLETO — ABSOLUTAMENTE DO ZERO, como se você estivesse configurando um DGX Spark recém-instalado, sem nada pronto.

Este guia será didático, organizado, sem pular etapas, sem atalhos, e explicando tudo.

🟩 GUIA DEFINITIVO — Instalar e Rodar HuMo AI no DGX Spark (GPU GB10)⌗

(Do zero absoluto → até gerar o primeiro vídeo)⌗

📘 1. Entender a arquitetura do seu DGX Spark⌗

Seu DGX Spark possui:

GPU NVIDIA GB10 (arquitetura Blackwell)
Driver: 580.95.05
CUDA: 13.0
Sistema Linux (Ubuntu Server / Desktop)

Isso importa porque:

Imagens Docker antigas (CUDA 12.x) não reconhecem GB10
Você precisa usar imagens CUDA 13+
PyTorch deve estar compilado para GPU Blackwell
Modelos grandes (como HuMo AI) precisam de grande VRAM → seu hardware aguenta

➡️ Seu DGX está perfeitamente preparado.

📘 2. Confirmar drivers e CUDA (no host, fora do Docker)⌗

Rode estas linhas:

nvidia-smi

Você tem que ver:

GPU: NVIDIA GB10
Driver: 580.xx
CUDA Version: 13.0

Se isso aparecer → perfeito.

Se der erro → driver está quebrado → precisa reinstalar (posso ensinar, mas no seu caso está OK).

📘 3. Verificar se Docker está instalado⌗

Rode:

docker --version

Se der algo como:

Docker version 24.x.x

→ ok Se der erro, instale:

sudo apt update sudo apt install docker.io -y sudo systemctl enable --now docker sudo usermod -aG docker $USER

📌 IMPORTANTE: Depois de adicionar o usuário ao grupo docker, rode:

newgrp docker

📘 4. Instalar NVIDIA Container Toolkit⌗

Para que o Docker use sua GPU, você precisa disso:

sudo apt install -y nvidia-container-toolkit sudo nvidia-ctk runtime configure --runtime=docker sudo systemctl restart docker

Teste:

docker run --rm --gpus all nvidia/cuda:12.3.0-base-ubuntu22.04 nvidia-smi

Se mostrar sua GPU → tudo certo.

📘 5. Criar diretório do projeto⌗

Faça no host:

mkdir -p ~/projetos/HuMo cd ~/projetos/HuMo

📘 6. Criar Dockerfile (compatível com GPU GB10)⌗

Crie o arquivo:

nano Dockerfile

Cole:

```FROM nvcr.io/nvidia/pytorch:25.01-py3

RUN apt-get update && apt-get install -y \ git \ git-lfs \ ffmpeg \ && rm -rf /var/lib/apt/lists/*

RUN pip install \ accelerate \ diffusers \ transformers==4.40 \ safetensors \ einops \ soundfile \ opencv-python \ imageio[ffmpeg] \ huggingface_hub \ gradio

WORKDIR /workspace RUN git clone github.com/Phantom-video/HuMo.git ↗

WORKDIR /workspace/HuMo RUN git lfs install```

Salvar: CTRL+O, ENTER Saída: CTRL+X

Explicação:

Imagem PyTorch 25.01 → suporta Blackwell / CUDA 13
Inclui FFmpeg → evitar erros ao gerar vídeos
Git LFS → necessário para baixar modelos do HuggingFace
Instala dependências do HuMo
Clona o repositório oficial

📘 7. Construir a imagem Docker⌗

No host:

docker build -t humoai .

Isso baixa tudo (pode demorar).

📘 8. Criar container com GPU habilitada⌗

Rodar:

docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \ -it --name humo_container \ -v $(pwd)/data:/workspace/HuMo/data \ humoai bash

Se entrar no container → ótimo.

Agora teste a GPU dentro dele:

nvidia-smi

Se aparecer a GB10 → funcionando.

O WARNING pode aparecer, mas se NÃO aparecer erro → está válido.

📘 9. Logar no HuggingFace (dentro do container)⌗

huggingface-cli login

Insira o token.

→ Você está autenticado.

📘 10. BAIXAR O MODELO HU MO (forma correta e segura)⌗

Porque “git clone” parece travar?⌗

Porque:

Git baixa só os 25 KB do repositório
Git LFS tenta baixar 8+ GB de arquivos grandes
E não mostra progresso dependendo da versão

Por isso parece travar no “done”.

A solução correta é:⌗

NÃO USAR git clone. Use o método oficial recomendado pela

chatgpt.com ↗

Guia completo para instalar e rodar o HuMo AI (modelo de geração de…

🟩 O que são os “pesos” (weights) de um modelo de IA?⌗

📌 Comparação simples:⌗

📦 Na prática:⌗

🎯 Resumo simples:⌗

🟩 1) Entrar no container⌗

🟦 2) Ir para a pasta do HuMo⌗

🟧 3) Gerar VÍDEO usando FOTO + TEXTO⌗

Comando:⌗

❗ O que você precisa fazer antes:⌗

✔️ Coloque sua foto dentro do container em:⌗

🟪 4) Gerar VÍDEO usando FOTO + ÁUDIO (lipsync)⌗

🟢 Onde o vídeo final aparece?⌗

✅ 1. Entrar no container⌗

✅ 2. Rodar um vídeo (dentro do container)⌗

🟢 Onde o vídeo fica?⌗

🎯 Resumo curtíssimo:⌗

🟩 1) PROCEDIMENTOS PARA ENTRAR NO DOCKER PELA PRIMEIRA VEZ E O QUE FAZER LÁ DENTRO⌗

✅ 1.1 — Criar o container (uma única vez)⌗

✅ 1.2 — Dentro do container, você deve fazer apenas isso:⌗

A) Verificar se a GPU está funcionando⌗

B) Logar no HuggingFace⌗

C) Baixar os modelos do HuMo AI⌗

D) Confirmar que os arquivos baixaram⌗

🟦 2) PROCEDIMENTOS PARA ENTRAR NO DOCKER DEPOIS E RODAR OS VÍDEOS⌗

✅ 2.1 — Iniciar o container (se estiver parado)⌗

✅ 2.2 — Entrar no container⌗

🟧 3) RODAR OS VÍDEOS (DENTRO DO CONTAINER)⌗

3.1 — Teste de geração de vídeo por texto⌗

3.2 — Teste imagem + texto⌗

3.3 — Teste áudio + imagem (lipsync)⌗

🟪 4) Onde ficam os vídeos gerados?⌗

🟩 RESUMÃO RÁPIDO⌗

Entrar a primeira vez + baixar modelo⌗

Entrar depois⌗

Gerar vídeo⌗

📘 11. Confirmar arquivos baixados⌗

📘 12. Rodar o PRIMEIRO teste⌗

📘 13. Conferir o vídeo⌗

🟩 14. O QUE VOCÊ TEM AGORA⌗

📘 15. Se quiser, posso gerar um PDF ou Markdown com tudo isso formatado.⌗

🟩 GUIA DEFINITIVO — Instalar e Rodar HuMo AI no DGX Spark (GPU GB10)⌗

(Do zero absoluto → até gerar o primeiro vídeo)⌗

📘 1. Entender a arquitetura do seu DGX Spark⌗

📘 2. Confirmar drivers e CUDA (no host, fora do Docker)⌗

📘 3. Verificar se Docker está instalado⌗

📘 4. Instalar NVIDIA Container Toolkit⌗

📘 5. Criar diretório do projeto⌗

📘 6. Criar Dockerfile (compatível com GPU GB10)⌗

📘 7. Construir a imagem Docker⌗

📘 8. Criar container com GPU habilitada⌗

📘 9. Logar no HuggingFace (dentro do container)⌗

📘 10. BAIXAR O MODELO HU MO (forma correta e segura)⌗

Porque “git clone” parece travar?⌗

A solução correta é:⌗

Recursos