cerebro-vip INEMA.CLUB
inícioINEMA.DEV Desenvolvimento

Guia completo para instalar e rodar o HuMo AI (modelo de geração de…

INEMA.DEV Desenvolvimento · 2025-11-23 · ~8 min · ver no Telegram ↗

INEMA

De forma simples e direta:

🟩 O que são os “pesos” (weights) de um modelo de IA?

São os arquivos que contêm o “conhecimento” aprendido pelo modelo.

Ou seja:

  • 👉 Os pesos são o cérebro do modelo.
  • 👉 Sem eles, o modelo não sabe fazer nada.

📌 Comparação simples:

  • O código do modelo = a máquina
  • Os pesos = a memória treinada que diz como a máquina deve agir
  • Sem pesos = máquina vazia, sem inteligência
  • Com pesos = modelo funcionando

📦 Na prática:

Os pesos são arquivos grandes como:

model.safetensors pytorch_model.bin checkpoint/

O HuMo AI, por exemplo, tem vários pesos (GBs). Eles contêm:

  • como desenhar rostos
  • como animar movimentos
  • como entender texto
  • como gerar vídeo
  • como sincronizar lábios

🎯 Resumo simples:

Pesos = conhecimento aprendido do modelo. Sem eles, o modelo não funciona.

Sim — o HuMo AI consegue gerar vídeo a partir de foto + texto, e também foto + áudio.

Aqui vai a forma simples e direta, como você pediu:


🟩 1) Entrar no container

docker start humo_container docker exec -it humo_container bash


🟦 2) Ir para a pasta do HuMo

cd /workspace/HuMo


🟧 3) Gerar VÍDEO usando FOTO + TEXTO

Comando:

python demo/imgtxt2video.py \ --ref_image images/minha_foto.png \ --prompt "a pessoa está sorrindo e mexendo a cabeça" \ --output_path /workspace/HuMo/data/video_foto_texto.mp4


❗ O que você precisa fazer antes:

✔️ Coloque sua foto dentro do container em:

/workspace/HuMo/images/

Ou, no host, coloque em:

~/projetos/HuMo/data/images

(a pasta está montada, depende do seu setup)

Se quiser criar a pasta:

mkdir -p /workspace/HuMo/images

E copiar para lá.


🟪 4) Gerar VÍDEO usando FOTO + ÁUDIO (lipsync)

Se você tiver uma foto e uma gravação de voz:

python demo/av2video.py \ --ref_image images/minha_foto.png \ --audio audio/minha_voz.wav \ --output_path /workspace/HuMo/data/video_foto_audio.mp4


🟢 Onde o vídeo final aparece?

No host:

~/projetos/HuMo/data/


Se quiser, posso te ajudar a:

  • criar a pasta certa para a foto,
  • copiar sua foto para dentro do container,
  • gerar um comando pronto com sua imagem.

Só me mandar:

o nome do arquivo da foto.

Claro. Aqui vai a forma mais simples e direta possível, sem enrolação:


✅ 1. Entrar no container

Primeiro, iniciar (caso esteja parado):

docker start humo_container

Depois, entrar:

docker exec -it humo_container bash

Pronto. Você está dentro.


✅ 2. Rodar um vídeo (dentro do container)

Texto → vídeo:

```cd /workspace/HuMo

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```


🟢 Onde o vídeo fica?

No host:

~/projetos/HuMo/data/video1.mp4


🎯 Resumo curtíssimo:

docker start humo_container docker exec -it humo_container bash cd /workspace/HuMo python demo/txt2video.py --prompt "texto aqui" --output_path /workspace/HuMo/data/video.mp4

Pronto. Isso é tudo que você precisa para entrar e gerar um vídeo.

🟩 1) PROCEDIMENTOS PARA ENTRAR NO DOCKER PELA PRIMEIRA VEZ E O QUE FAZER LÁ DENTRO

✅ 1.1 — Criar o container (uma única vez)

No host (fora do container), dentro da pasta do projeto:

docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \ -it --name humo_container \ -v $(pwd)/data:/workspace/HuMo/data \ humoai bash

👉 Esse comando cria o container e já entra nele.


✅ 1.2 — Dentro do container, você deve fazer apenas isso:

A) Verificar se a GPU está funcionando

nvidia-smi

B) Logar no HuggingFace

huggingface-cli login

Cole seu token e confirme.

C) Baixar os modelos do HuMo AI

```cd /workspace/HuMo rm -rf checkpoints mkdir checkpoints

huggingface-cli download bytedance-research/HuMo \ --local-dir checkpoints \ --local-dir-use-symlinks False```

D) Confirmar que os arquivos baixaram

ls -lh checkpoints

👉 Pronto. Depois disso o ambiente interno está preparado.


🟦 2) PROCEDIMENTOS PARA ENTRAR NO DOCKER DEPOIS E RODAR OS VÍDEOS

Depois que o container já existe, você NÃO cria ele de novo.

Você apenas entra nele.


✅ 2.1 — Iniciar o container (se estiver parado)

docker start humo_container

✅ 2.2 — Entrar no container

docker exec -it humo_container bash

Agora você está lá dentro.


🟧 3) RODAR OS VÍDEOS (DENTRO DO CONTAINER)

3.1 — Teste de geração de vídeo por texto

```cd /workspace/HuMo

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path /workspace/HuMo/data/video1.mp4```

3.2 — Teste imagem + texto

python demo/imgtxt2video.py \ --ref_image images/teste.png \ --prompt "falando e sorrindo" \ --output_path /workspace/HuMo/data/video_img.mp4

3.3 — Teste áudio + imagem (lipsync)

python demo/av2video.py \ --ref_image images/teste.png \ --audio audio/voz.wav \ --output_path /workspace/HuMo/data/video_audio.mp4


🟪 4) Onde ficam os vídeos gerados?

Fora do container, no host:

~/projetos/HuMo/data

Porque montamos essa pasta com:

-v $(pwd)/data:/workspace/HuMo/data


🟩 RESUMÃO RÁPIDO

Entrar a primeira vez + baixar modelo

docker run --gpus all ... humoai bash huggingface-cli login huggingface-cli download ...

Entrar depois

docker start humo_container docker exec -it humo_container bash

Gerar vídeo

python demo/txt2video.py ...

dentro do docker

o dockerfile1 nao funcionou[

HuggingFace:

Dentro do container:

cd /workspace/HuMo rm -rf checkpoints mkdir checkpoints huggingface-cli download bytedance-research/HuMo \ --local-dir checkpoints \ --local-dir-use-symlinks False

Isso baixa com barra de progresso e não trava.


📘 11. Confirmar arquivos baixados

ls -lh checkpoints

Deve ter arquivos .safetensors grandes (1–4 GB cada).


📘 12. Rodar o PRIMEIRO teste

python demo/txt2video.py \ --prompt "uma pessoa sorrindo e acenando" \ --output_path output.mp4

Se gerar sem erro → parabéns, o HuMo está rodando no seu DGX.


📘 13. Conferir o vídeo

No host:

ls -lh ~/projetos/HuMo/data

Ou copie para sua máquina:

scp DGX:/home/.../output.mp4 .


🟩 14. O QUE VOCÊ TEM AGORA

Você tem:

  • Docker funcionando
  • Container GPU-aware
  • Imagem PyTorch Blackwell
  • HuMo AI instalado
  • Modelos baixados
  • Geração de vídeo funcionando

📘 15. Se quiser, posso gerar um PDF ou Markdown com tudo isso formatado.

Pergunta: 🟦 Quer o documento final em:

  1. Markdown (.md)
  2. PDF
  3. Ambos

Só responder com 1, 2 ou 3.

Perfeito. Agora vou entregar o GUIA COMPLETO — ABSOLUTAMENTE DO ZERO, como se você estivesse configurando um DGX Spark recém-instalado, sem nada pronto.

Este guia será didático, organizado, sem pular etapas, sem atalhos, e explicando tudo.


🟩 GUIA DEFINITIVO — Instalar e Rodar HuMo AI no DGX Spark (GPU GB10)

(Do zero absoluto → até gerar o primeiro vídeo)


📘 1. Entender a arquitetura do seu DGX Spark

Seu DGX Spark possui:

  • GPU NVIDIA GB10 (arquitetura Blackwell)
  • Driver: 580.95.05
  • CUDA: 13.0
  • Sistema Linux (Ubuntu Server / Desktop)

Isso importa porque:

  • Imagens Docker antigas (CUDA 12.x) não reconhecem GB10
  • Você precisa usar imagens CUDA 13+
  • PyTorch deve estar compilado para GPU Blackwell
  • Modelos grandes (como HuMo AI) precisam de grande VRAM → seu hardware aguenta

➡️ Seu DGX está perfeitamente preparado.


📘 2. Confirmar drivers e CUDA (no host, fora do Docker)

Rode estas linhas:

nvidia-smi

Você tem que ver:

  • GPU: NVIDIA GB10
  • Driver: 580.xx
  • CUDA Version: 13.0

Se isso aparecer → perfeito.

Se der erro → driver está quebrado → precisa reinstalar (posso ensinar, mas no seu caso está OK).


📘 3. Verificar se Docker está instalado

Rode:

docker --version

Se der algo como:

Docker version 24.x.x

→ ok Se der erro, instale:

sudo apt update sudo apt install docker.io -y sudo systemctl enable --now docker sudo usermod -aG docker $USER

📌 IMPORTANTE: Depois de adicionar o usuário ao grupo docker, rode:

newgrp docker


📘 4. Instalar NVIDIA Container Toolkit

Para que o Docker use sua GPU, você precisa disso:

sudo apt install -y nvidia-container-toolkit sudo nvidia-ctk runtime configure --runtime=docker sudo systemctl restart docker

Teste:

docker run --rm --gpus all nvidia/cuda:12.3.0-base-ubuntu22.04 nvidia-smi

Se mostrar sua GPU → tudo certo.


📘 5. Criar diretório do projeto

Faça no host:

mkdir -p ~/projetos/HuMo cd ~/projetos/HuMo


📘 6. Criar Dockerfile (compatível com GPU GB10)

Crie o arquivo:

nano Dockerfile

Cole:

```FROM nvcr.io/nvidia/pytorch:25.01-py3

RUN apt-get update && apt-get install -y \ git \ git-lfs \ ffmpeg \ && rm -rf /var/lib/apt/lists/*

RUN pip install \ accelerate \ diffusers \ transformers==4.40 \ safetensors \ einops \ soundfile \ opencv-python \ imageio[ffmpeg] \ huggingface_hub \ gradio

WORKDIR /workspace RUN git clone github.com/Phantom-video/HuMo.git ↗

WORKDIR /workspace/HuMo RUN git lfs install```

Salvar: CTRL+O, ENTER Saída: CTRL+X

Explicação:

  • Imagem PyTorch 25.01 → suporta Blackwell / CUDA 13
  • Inclui FFmpeg → evitar erros ao gerar vídeos
  • Git LFS → necessário para baixar modelos do HuggingFace
  • Instala dependências do HuMo
  • Clona o repositório oficial

📘 7. Construir a imagem Docker

No host:

docker build -t humoai .

Isso baixa tudo (pode demorar).


📘 8. Criar container com GPU habilitada

Rodar:

docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \ -it --name humo_container \ -v $(pwd)/data:/workspace/HuMo/data \ humoai bash

Se entrar no container → ótimo.

Agora teste a GPU dentro dele:

nvidia-smi

Se aparecer a GB10 → funcionando.

O WARNING pode aparecer, mas se NÃO aparecer erro → está válido.


📘 9. Logar no HuggingFace (dentro do container)

huggingface-cli login

Insira o token.

→ Você está autenticado.


📘 10. BAIXAR O MODELO HU MO (forma correta e segura)

Porque “git clone” parece travar?

Porque:

  • Git baixa só os 25 KB do repositório
  • Git LFS tenta baixar 8+ GB de arquivos grandes
  • E não mostra progresso dependendo da versão

Por isso parece travar no “done”.

A solução correta é:

NÃO USAR git clone. Use o método oficial recomendado pela

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗