Tutorial de reconstrução do "Hormozi GPT" (chatbot RAG de US$ 6 mil)…

INEMA

Aqui está o passo a passo detalhado para recriar o chatbot estilo “Hormozi GPT” usando Pinecone Assistant, n8n e um GPT customizado, conforme descrito no vídeo e no conteúdo da Skool (mesmo sem acesso direto):

⚙️ Etapa 1 – Criar o Pinecone Assistant (sem vetorização manual)⌗

1.1 Acesse o Pinecone (https://app.pinecone.io/)⌗

Vá em Assistants (não “Indexes”)
Clique em Create Assistant
Dê um nome, ex: mosey ou mz

1.2 Faça upload dos arquivos (playbooks, PDFs etc.)⌗

Pode ser PDF com texto ou OCR feito
Arraste e solte os documentos
Ele vai processar automaticamente e aplicar RAG (retrieval-augmented generation)

💬 Etapa 2 – Teste com interface web da Pinecone⌗

2.1 Escolha o modelo (ex: Claude 3.5 Sonnet, GPT-4)⌗

Use o modelo preferido para responder via RAG

2.2 Escreva perguntas⌗

Exemplo:

“Como posso melhorar o LTV da minha lavanderia com soluções de IA?”

2.3 Veja o retorno com:⌗

Resposta baseada nos documentos
Referência das páginas
Nome do PDF de origem

🔁 Etapa 3 – Requisição via API (para N8n ou GPT customizado)⌗

3.1 Vá em Assistants > seu assistant > API⌗

Copie o endpoint da API

https://api.pinecone.io/assistants/{nome-do-assistant}/messages

3.2 Gere sua API Key:⌗

Vá em Settings > API Keys
Crie e copie sua chave

🧱 Etapa 4 – Criar fluxo no n8n⌗

4.1 Crie um novo fluxo e adicione os nós:⌗

Webhook ou Start *** HTTP Request *** Set (opcional para formatar resposta)

4.2 Configure o nó HTTP Request:⌗

Parâmetro	Valor
URL	h`ttps://api.pinecone.io/assistants/mosey/messages`
Método	P`OST`
Headers	A`uthorization: Bearer SUA_API_KEY` C`ontent-Type: application/json`
Body	Raw JSON

Exemplo de Body:⌗

{"role": "user", "content": "Como melhorar o LTV da minha lavanderia com IA?" }

4.3 Salve e teste⌗

🤖 Etapa 5 – GPT Customizado com Webhook (opcional)⌗

Você pode integrar esse assistant com um GPT personalizado:

Vá até https://chat.openai.com/gpts 2. Crie um GPT com Webhook 3. Use o mesmo endpoint da Pinecone (via n8n ou direto)
Configure a estrutura JSON de entrada 5. Defina um prompt de sistema inteligente (que valida, empurra de volta perguntas malformadas, etc.)

🧠 Etapa 6 – Atualização contínua do conhecimento (RAG)⌗

Se quiser adicionar mais conhecimento:

Converta transcrições de vídeos ou podcasts em PDF
Envie para o mesmo Assistant
Sem precisar retreinar, vetorização nem mexer no banco

💡 Dica Avançada: Prompt de Sistema (Anti-spam)⌗

Exemplo:

“Você só responde perguntas específicas relacionadas aos PDFs carregados. Se a pergunta for genérica, peça para o usuário reformular.”

✅ Conclusão – Você agora tem:⌗

Um chatbot com RAG que responde com fontes e páginas
Rodando em 5 minutos, sem Pinecone Index manual
Pode usar n8n, front-end, GPTs customizados com o mesmo motor

O que são os JSON que ele compartilhou?⌗

Eles são estruturas de requisição HTTP, no formato cURL ou payloads JSON, usados para:

Chamar a API do Pinecone Assistant
Enviar uma pergunta e receber uma resposta com RAG
Incluir metadados como nome do assistente, chave da API e prompt customizado

Ou seja, são pedaços de configuração, que ele:

Transforma em requisições cURL
E importa para o N8n usando um nó do tipo HTTP Request (ou Webhook)

Esse JSON é o corpo do request enviado via HTTP para o Pinecone Assistant.

Como ele usa no N8n⌗

Cria um nó "HTTP Request"
Coloca o método como POST
Cola o URL da API do Pinecone Assistant
Insere os headers com API Key
Insere o body JSON com a mensagem
O output da resposta é exibido em outro nó (ex: “Set”, “Function”, ou “Webhook Response”)

Resumo⌗

JSONs = estrutura de chamada à API, não são fluxos do N8n
Você usa esses JSONs dentro de um nó HTTP Request
Ele criou dois exemplos: um para N8n, outro para um GPT customizado (com pequenas diferenças)

Resumo Geral⌗

O criador mostra como reconstruir o Hermozi GPT (um chatbot caro com RAG e LangGraph) de forma simples, barata e rápida usando:

Pinecone Assistant (RAG pronto)
N8n (automação)
Custom GPT com webhook
Tudo isso feito em 1 hora de trabalho

1. Pinecone Assistant: RAG simplificado⌗

Conceito:⌗

Basta arrastar e soltar PDFs
Ele faz RAG automaticamente
Mostra respostas com citações e páginas exatas
Exemplo: pergunta sobre como escalar uma agência de IA de \$1M para \$1.9M

Custo:⌗

Cerca de US\$ 0,05 por hora
Pode ligar/desligar conforme o uso
Aproximadamente US\$ 5-10 por mês

2. Construção no N8n (com API)⌗

O que foi feito:⌗

Criou requisição cURL conectando Pinecone ao N8n
Workflow recebe a pergunta → envia ao Pinecone Assistant → retorna com resposta e referências

Funcionalidades:⌗

Prompt configurado para "conversar" com o usuário
Não aceita qualquer pergunta (ex: “oi”), força clareza
Exemplo de pergunta: "Como melhorar o LTV da minha lavanderia?"

3. Integração com GPT customizado⌗

Integração:⌗

Cria GPT que envia as perguntas via webhook para o Pinecone Assistant
O nome do assistente e a API key devem ser personalizados

Resultado:⌗

Mesmo sistema do N8n, mas com entrada JSON do GPT
Pode ser usado por produtos, front-end, etc.

4. Atualização de base com transcrições⌗

Estratégia esperta:⌗

Pegue uma transcrição de vídeo (ex: 7h de Hormozi)
Converta para PDF e envie para o Assistant
Assim, você atualiza seu RAG sem saber vetorização

5. Dicas práticas do criador⌗

Estilo:⌗

Busca resultados rápidos e práticos
Evita complexidade desnecessária (ex: vetorização manual)
Prefere pagar barato por ferramentas que economizam tempo

Resultado final:⌗

Um chatbot de nível profissional (US\$ 6 mil) construído com ferramentas acessíveis e em menos de 1 hora.

Reconstruí o chatbot de US$ 6 mil da Hormozi em 5 minutos... Aproveite 🌹(3 maneiras)

Muitos pediram para reconstruir o Hormozi GPT - em vez do sofisticado RAG e do LangGraph, obtive o mesmo resultado em 5 minutos com o Pinecone Assistanto que torna isso idêntico à versão de US$ 6.000:

→ citações de páginas exatas quando você clica em referências → pesquisas em todos os manuais e recursos → fundamenta respostas em estruturas específicas → realmente funciona (ao contrário do original)

Criei 3 versões para você (TODOS OS RECURSOS ANEXADOS A ESTA POSTAGEM): → Assistente Pinecone (arrastar e soltar PDFs, pronto) → Fluxo de trabalho n8n com integração de API → GPT personalizado com esquema de webhook

O molho secreto: o Pinecone Assistant faz o RAG automaticamente - basta carregar os arquivos e ele cuida da vetorização, sem dores de cabeça

Comparação de custos: US$ 5-10/mês vs US$ 6.000

Jogada bônus: pegue os streams de 7 horas do Hormozi no YouTube, converta as transcrições em PDFs, coloque-os - agora você tem ainda mais conhecimento do que o original

Todos os prompts, esquemas e fluxos de trabalho incluídos nesta postagem - você pode literalmente clonar um produto de US$ 6.000 em menos de uma hora

Veja q às vezes as melhores soluções são as mais preguiçosas

m32 - ChatBot Hormozi $6k

chatgpt.com ↗