cerebro-vip INEMA.CLUB
inícioINEMA.LLMS

Tutorial completo para montar o localGPT 2.0 com suporte a português…

INEMA.LLMS · 2025-07-17 · ~5 min · ver no Telegram ↗

INEMA

youtube.com/watch ↗

github.com ↗

A versão 2.0 está em um branch separado (localgpt-v2) dentro desse mesmo repositório. Ou seja:

  • 📂 Branch: localgpt-v2
  • 📦 Não está na branch principal (main).

🔗 github.com/PromtEngineer/localGPT ↗

  1. Instalar Python 3.10+ e pip
  2. Instalar NodeJS e npm
  3. Instalar Git
  4. Instalar Ollama
  5. Clonar repositório do localGPT v2
  6. Criar ambiente virtual
  7. Instalar dependências Python
  8. Instalar dependências frontend
  9. Baixar Qwen Embedding
  10. Configurar OpenAI ada-002 (opcional)
  11. Adicionar outro embedding multilíngue (opcional)
  12. Criar pasta documents e adicionar arquivos
  13. Rodar backend
  14. Rodar frontend
  15. Criar índice com opções avançadas
  16. Fazer perguntas em português
  17. Alternar entre Qwen e ada-002 para comparar

🎁 Bônus: Melhorias

  • Pode trocar FAISS por PostgreSQL + pgvector para gerenciar vetores e metadados juntos.
  • Pode adicionar Vision OCR para PDFs escaneados.
  • Pode integrar LangChain para fluxos mais complexos.

Um passo a passo completo e detalhado para montar o localGPT 2.0 com suporte total a português Brasil, rodando localmente com:

  • Qwen Embedding (padrão)
  • OpenAI ada-002 (opcional para comparar)
  • ✅ E compatível com outros embeddings multilíngues (ex: BGE, MiniLM)

Tudo pronto para:

  • 📂 Indexar documentos (PDF, TXT) em português
  • 💬 Perguntar em português
  • 🔒 100% local (ou com API OpenAI se quiser usar ada-002)

🏆 Solução Completa: localGPT 2.0 com PT-BR

Organizado em 6 fases, cada uma com comandos e explicações.


🔥 FASE 1: Preparar o ambiente

1️⃣ Instalar dependências principais

Python 3.10+ e pip

Linux:

sudo apt update sudo apt install python3 python3-pip python3-venv -y

Windows/Mac:


NodeJS e npm

Linux:

sudo apt install nodejs npm -y

Windows/Mac:


Git

sudo apt install git -y # Linux

Windows: Baixar Git for Windows https://git-scm.com/download/win


2️⃣ Instalar Ollama (para rodar Qwen localmente)

curl https://ollama.com/install.sh | sh # Linux/Mac

Windows: Baixar instalador https://ollama.com/download



📦 FASE 2: Clonar e configurar o localGPT 2.0

3️⃣ Clonar repositório do localGPT v2

git clone -b localgpt-v2 https://github.com/PromtEngineer/localGPT.git cd localGPT


4️⃣ Criar ambiente virtual

python3 -m venv venv source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows


5️⃣ Instalar dependências Python

pip install -r requirements.txt


6️⃣ Instalar dependências frontend

npm install



🧠 FASE 3: Configurar embeddings multilíngues

7️⃣ Baixar Qwen Embedding

ollama pull qwen:7b


8️⃣ (Opcional) Configurar OpenAI ada-002

  • Criar arquivo .env na raiz do projeto:

OPENAI_API_KEY=sk-XXXXXXXXXXXXXXXXXXXXXX

  • Alterar backend para usar OpenAI:

from langchain.embeddings import OpenAIEmbeddings embeddings = OpenAIEmbeddings()


9️⃣ (Opcional) Adicionar outro embedding multilíngue

Exemplo com BGE-Large (ótimo para PT-BR):

ollama pull BAAI/bge-large-en-v1.5

Depois configure o localGPT para apontar para ele.



📂 FASE 4: Adicionar documentos

🔟 Colocar arquivos em português

Crie a pasta documents:

mkdir documents

Adicione seus PDFs/TXT em português aqui:

localGPT/documents/contrato1.pdf localGPT/documents/relatorio-saude-brasil.txt



⚙️ FASE 5: Rodar o localGPT

1️⃣1️⃣ Iniciar backend

p```ython backend_server.py

---

### 1️⃣2️⃣ Iniciar frontend

Em outro terminal:

n```pm run dev

Acesse no navegador: http://localhost:3000



💬 FASE 6: Usar em português Brasil

✅ Crie o índice:

  • Selecione High Recall Chunking *** Ative Contextual Retrieval *** Escolha Hybrid Search para combinar dense e full-text.

✅ Faça perguntas em PT-BR:

Exemplos:

  • “Quais são as vantagens da inteligência artificial na saúde pública brasileira?”
  • “Liste exemplos de uso de IA no SUS.”


🏎️ Comparar embeddings

🔄 Alternar entre Qwen e ada-002

  1. Use Qwen (padrão) e faça perguntas.
  2. Alterne para ada-002 no backend e refaça as mesmas perguntas.
  3. Observe diferenças de entendimento (Qwen pode falhar em gírias ou termos culturais brasileiros, ada-002 acerta mais).

📌 Resultado final

✅ localGPT 2.0 rodando localmente com:

  • Qwen Embedding (offline e gratuito)
  • OpenAI ada-002 (online e pago, mas com suporte PT-BR superior)
  • Suporte a outros embeddings multilíngues (BGE, MiniLM, etc.)

✅ Indexando e respondendo em português Brasil. ✅ Interface web para Consultas

🚀 Resumo da Solução localGPT 2.0

📖 O que é?

Um sistema RAG (Retrieval-Augmented Generation) totalmente local que: ✅ Permite conversar com seus documentos (PDF, TXT, etc.) em português Brasil ✅ Funciona offline com modelos de linguagem locais (Qwen) ✅ Também pode usar modelos da OpenAI (ada-002) se quiser mais qualidade multilíngue


⚙️ Como funciona?

  1. 📂 Indexa documentos locais:
  • Lê seus arquivos em português
  • Cria vetores de embeddings (com Qwen ou outro modelo)
  • Armazena os vetores em FAISS (local)
  1. 💬 Responde perguntas:
  • Decide se precisa buscar nos documentos ou responder com o conhecimento do modelo
  • Recupera trechos relevantes dos documentos
  • Gera respostas combinando os trechos com o LLM
  1. 🌐 Interface Web:
  • Você acessa via navegador
  • Pode criar índices, fazer consultas e ver resultados
  1. 🔒 Privacidade total:
  • Tudo roda no seu computador
  • Nenhum dado é enviado para a nuvem (a menos que você ative o OpenAI)

🧠 Compatibilidade

  • Embeddings locais: Qwen (padrão), BGE, MiniLM, etc.
  • Embeddings externos: OpenAI ada-002 (opcional)
  • Idiomas: Suporte a português Brasil (parcial no Qwen, excelente no ada-002)

🎯 Para que serve?

✅ Fazer perguntas em português sobre seus arquivos (contratos, relatórios, livros, etc.) ✅ Usar IA local sem custos ou dependência de APIs externas ✅ Comparar modelos (Qwen vs OpenAI ada-002) para ver qual responde melhor em português

LocalGPT20 - RAG - PT

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗