Tutorial de reconstrução do "Hormozi GPT" (chatbot RAG de US$ 6 mil)…
INEMA
Aqui está o passo a passo detalhado para recriar o chatbot estilo “Hormozi GPT” usando Pinecone Assistant, n8n e um GPT customizado, conforme descrito no vídeo e no conteúdo da Skool (mesmo sem acesso direto):
⚙️ Etapa 1 – Criar o Pinecone Assistant (sem vetorização manual)⌗
1.1 Acesse o Pinecone (https://app.pinecone.io/)⌗
- Vá em Assistants (não “Indexes”)
- Clique em Create Assistant
- Dê um nome, ex:
moseyoumz
1.2 Faça upload dos arquivos (playbooks, PDFs etc.)⌗
- Pode ser PDF com texto ou OCR feito
- Arraste e solte os documentos
- Ele vai processar automaticamente e aplicar RAG (retrieval-augmented generation)
💬 Etapa 2 – Teste com interface web da Pinecone⌗
2.1 Escolha o modelo (ex: Claude 3.5 Sonnet, GPT-4)⌗
- Use o modelo preferido para responder via RAG
2.2 Escreva perguntas⌗
Exemplo:
“Como posso melhorar o LTV da minha lavanderia com soluções de IA?”
2.3 Veja o retorno com:⌗
- Resposta baseada nos documentos
- Referência das páginas
- Nome do PDF de origem
🔁 Etapa 3 – Requisição via API (para N8n ou GPT customizado)⌗
3.1 Vá em Assistants > seu assistant > API⌗
- Copie o endpoint da API
https://api.pinecone.io/assistants/{nome-do-assistant}/messages
3.2 Gere sua API Key:⌗
- Vá em Settings > API Keys
- Crie e copie sua chave
🧱 Etapa 4 – Criar fluxo no n8n⌗
4.1 Crie um novo fluxo e adicione os nós:⌗
- Webhook ou Start *** HTTP Request *** Set (opcional para formatar resposta)
4.2 Configure o nó HTTP Request:⌗
| Parâmetro | Valor |
|---|---|
| URL | https://api.pinecone.io/assistants/mosey/messages |
| Método | POST |
| Headers | Authorization: Bearer SUA_API_KEYC ontent-Type: application/json |
| Body | Raw JSON |
Exemplo de Body:⌗
{"role": "user",
"content": "Como melhorar o LTV da minha lavanderia com IA?"
}
4.3 Salve e teste⌗
🤖 Etapa 5 – GPT Customizado com Webhook (opcional)⌗
Você pode integrar esse assistant com um GPT personalizado:
- Vá até https://chat.openai.com/gpts 2. Crie um GPT com Webhook 3. Use o mesmo endpoint da Pinecone (via n8n ou direto)
- Configure a estrutura JSON de entrada 5. Defina um prompt de sistema inteligente (que valida, empurra de volta perguntas malformadas, etc.)
🧠 Etapa 6 – Atualização contínua do conhecimento (RAG)⌗
Se quiser adicionar mais conhecimento:
- Converta transcrições de vídeos ou podcasts em PDF
- Envie para o mesmo Assistant
- Sem precisar retreinar, vetorização nem mexer no banco
💡 Dica Avançada: Prompt de Sistema (Anti-spam)⌗
Exemplo:
“Você só responde perguntas específicas relacionadas aos PDFs carregados. Se a pergunta for genérica, peça para o usuário reformular.”
✅ Conclusão – Você agora tem:⌗
- Um chatbot com RAG que responde com fontes e páginas
- Rodando em 5 minutos, sem Pinecone Index manual
- Pode usar n8n, front-end, GPTs customizados com o mesmo motor
O que são os JSON que ele compartilhou?⌗
Eles são estruturas de requisição HTTP, no formato cURL ou payloads JSON, usados para:
- Chamar a API do Pinecone Assistant
- Enviar uma pergunta e receber uma resposta com RAG
- Incluir metadados como nome do assistente, chave da API e prompt customizado
Ou seja, são pedaços de configuração, que ele:
- Transforma em requisições cURL
- E importa para o N8n usando um nó do tipo HTTP Request (ou Webhook)
Esse JSON é o corpo do request enviado via HTTP para o Pinecone Assistant.
Como ele usa no N8n⌗
- Cria um nó "HTTP Request"
- Coloca o método como
POST - Cola o URL da API do Pinecone Assistant
- Insere os headers com API Key
- Insere o body JSON com a mensagem
- O output da resposta é exibido em outro nó (ex: “Set”, “Function”, ou “Webhook Response”)
Resumo⌗
- JSONs = estrutura de chamada à API, não são fluxos do N8n
- Você usa esses JSONs dentro de um nó HTTP Request
- Ele criou dois exemplos: um para N8n, outro para um GPT customizado (com pequenas diferenças)
Resumo Geral⌗
O criador mostra como reconstruir o Hermozi GPT (um chatbot caro com RAG e LangGraph) de forma simples, barata e rápida usando:
- Pinecone Assistant (RAG pronto)
- N8n (automação)
- Custom GPT com webhook
- Tudo isso feito em 1 hora de trabalho
1. Pinecone Assistant: RAG simplificado⌗
Conceito:⌗
- Basta arrastar e soltar PDFs
- Ele faz RAG automaticamente
- Mostra respostas com citações e páginas exatas
- Exemplo: pergunta sobre como escalar uma agência de IA de \$1M para \$1.9M
Custo:⌗
- Cerca de US\$ 0,05 por hora
- Pode ligar/desligar conforme o uso
- Aproximadamente US\$ 5-10 por mês
2. Construção no N8n (com API)⌗
O que foi feito:⌗
- Criou requisição cURL conectando Pinecone ao N8n
- Workflow recebe a pergunta → envia ao Pinecone Assistant → retorna com resposta e referências
Funcionalidades:⌗
- Prompt configurado para "conversar" com o usuário
- Não aceita qualquer pergunta (ex: “oi”), força clareza
- Exemplo de pergunta: "Como melhorar o LTV da minha lavanderia?"
3. Integração com GPT customizado⌗
Integração:⌗
- Cria GPT que envia as perguntas via webhook para o Pinecone Assistant
- O nome do assistente e a API key devem ser personalizados
Resultado:⌗
- Mesmo sistema do N8n, mas com entrada JSON do GPT
- Pode ser usado por produtos, front-end, etc.
4. Atualização de base com transcrições⌗
Estratégia esperta:⌗
- Pegue uma transcrição de vídeo (ex: 7h de Hormozi)
- Converta para PDF e envie para o Assistant
- Assim, você atualiza seu RAG sem saber vetorização
5. Dicas práticas do criador⌗
Estilo:⌗
- Busca resultados rápidos e práticos
- Evita complexidade desnecessária (ex: vetorização manual)
- Prefere pagar barato por ferramentas que economizam tempo
Resultado final:⌗
- Um chatbot de nível profissional (US\$ 6 mil) construído com ferramentas acessíveis e em menos de 1 hora.
Reconstruí o chatbot de US$ 6 mil da Hormozi em 5 minutos... Aproveite 🌹(3 maneiras)
Muitos pediram para reconstruir o Hormozi GPT - em vez do sofisticado RAG e do LangGraph, obtive o mesmo resultado em 5 minutos com o Pinecone Assistanto que torna isso idêntico à versão de US$ 6.000:
→ citações de páginas exatas quando você clica em referências → pesquisas em todos os manuais e recursos → fundamenta respostas em estruturas específicas → realmente funciona (ao contrário do original)
Criei 3 versões para você (TODOS OS RECURSOS ANEXADOS A ESTA POSTAGEM): → Assistente Pinecone (arrastar e soltar PDFs, pronto) → Fluxo de trabalho n8n com integração de API → GPT personalizado com esquema de webhook
O molho secreto: o Pinecone Assistant faz o RAG automaticamente - basta carregar os arquivos e ele cuida da vetorização, sem dores de cabeça
Comparação de custos: US$ 5-10/mês vs US$ 6.000
Jogada bônus: pegue os streams de 7 horas do Hormozi no YouTube, converta as transcrições em PDFs, coloque-os - agora você tem ainda mais conhecimento do que o original
Todos os prompts, esquemas e fluxos de trabalho incluídos nesta postagem - você pode literalmente clonar um produto de US$ 6.000 em menos de uma hora
Veja q às vezes as melhores soluções são as mais preguiçosas
m32 - ChatBot Hormozi $6k
1