Tutorial completo para montar o localGPT 2.0 com suporte a português…
INEMA
A versão 2.0 está em um branch separado (localgpt-v2) dentro desse mesmo repositório. Ou seja:
- 📂 Branch:
localgpt-v2 - 📦 Não está na branch principal (main).
🔗 github.com/PromtEngineer/localGPT ↗
- Instalar Python 3.10+ e pip
- Instalar NodeJS e npm
- Instalar Git
- Instalar Ollama
- Clonar repositório do localGPT v2
- Criar ambiente virtual
- Instalar dependências Python
- Instalar dependências frontend
- Baixar Qwen Embedding
- Configurar OpenAI ada-002 (opcional)
- Adicionar outro embedding multilíngue (opcional)
- Criar pasta documents e adicionar arquivos
- Rodar backend
- Rodar frontend
- Criar índice com opções avançadas
- Fazer perguntas em português
- Alternar entre Qwen e ada-002 para comparar
🎁 Bônus: Melhorias⌗
- Pode trocar FAISS por PostgreSQL + pgvector para gerenciar vetores e metadados juntos.
- Pode adicionar Vision OCR para PDFs escaneados.
- Pode integrar LangChain para fluxos mais complexos.
Um passo a passo completo e detalhado para montar o localGPT 2.0 com suporte total a português Brasil, rodando localmente com:
- ✅ Qwen Embedding (padrão)
- ✅ OpenAI ada-002 (opcional para comparar)
- ✅ E compatível com outros embeddings multilíngues (ex: BGE, MiniLM)
Tudo pronto para:
- 📂 Indexar documentos (PDF, TXT) em português
- 💬 Perguntar em português
- 🔒 100% local (ou com API OpenAI se quiser usar ada-002)
🏆 Solução Completa: localGPT 2.0 com PT-BR⌗
Organizado em 6 fases, cada uma com comandos e explicações.
🔥 FASE 1: Preparar o ambiente⌗
1️⃣ Instalar dependências principais⌗
Python 3.10+ e pip⌗
Linux:
sudo apt update
sudo apt install python3 python3-pip python3-venv -y
Windows/Mac:
- Baixar Python 3.10+ em https://www.python.org/downloads/
- Durante instalação, marcar “Add Python to PATH”
NodeJS e npm⌗
Linux:
sudo apt install nodejs npm -y
Windows/Mac:
- Baixar em https://nodejs.org/en/download
Git⌗
sudo apt install git -y # Linux
Windows: Baixar Git for Windows https://git-scm.com/download/win
2️⃣ Instalar Ollama (para rodar Qwen localmente)⌗
curl https://ollama.com/install.sh | sh # Linux/Mac
Windows: Baixar instalador https://ollama.com/download
📦 FASE 2: Clonar e configurar o localGPT 2.0⌗
3️⃣ Clonar repositório do localGPT v2⌗
git clone -b localgpt-v2 https://github.com/PromtEngineer/localGPT.git
cd localGPT
4️⃣ Criar ambiente virtual⌗
python3 -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
5️⃣ Instalar dependências Python⌗
pip install -r requirements.txt
6️⃣ Instalar dependências frontend⌗
npm install
🧠 FASE 3: Configurar embeddings multilíngues⌗
7️⃣ Baixar Qwen Embedding⌗
ollama pull qwen:7b
8️⃣ (Opcional) Configurar OpenAI ada-002⌗
- Criar arquivo
.envna raiz do projeto:
OPENAI_API_KEY=sk-XXXXXXXXXXXXXXXXXXXXXX
- Alterar backend para usar OpenAI:
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()
9️⃣ (Opcional) Adicionar outro embedding multilíngue⌗
Exemplo com BGE-Large (ótimo para PT-BR):
ollama pull BAAI/bge-large-en-v1.5
Depois configure o localGPT para apontar para ele.
📂 FASE 4: Adicionar documentos⌗
🔟 Colocar arquivos em português⌗
Crie a pasta documents:
mkdir documents
Adicione seus PDFs/TXT em português aqui:
localGPT/documents/contrato1.pdf
localGPT/documents/relatorio-saude-brasil.txt
⚙️ FASE 5: Rodar o localGPT⌗
1️⃣1️⃣ Iniciar backend⌗
p```ython backend_server.py
---
### 1️⃣2️⃣ Iniciar frontend
Em outro terminal:
n```pm run dev
Acesse no navegador:
http://localhost:3000
💬 FASE 6: Usar em português Brasil⌗
✅ Crie o índice:⌗
- Selecione High Recall Chunking *** Ative Contextual Retrieval *** Escolha Hybrid Search para combinar dense e full-text.
✅ Faça perguntas em PT-BR:⌗
Exemplos:
- “Quais são as vantagens da inteligência artificial na saúde pública brasileira?”
- “Liste exemplos de uso de IA no SUS.”
🏎️ Comparar embeddings⌗
🔄 Alternar entre Qwen e ada-002⌗
- Use Qwen (padrão) e faça perguntas.
- Alterne para ada-002 no backend e refaça as mesmas perguntas.
- Observe diferenças de entendimento (Qwen pode falhar em gírias ou termos culturais brasileiros, ada-002 acerta mais).
📌 Resultado final⌗
✅ localGPT 2.0 rodando localmente com:
- Qwen Embedding (offline e gratuito)
- OpenAI ada-002 (online e pago, mas com suporte PT-BR superior)
- Suporte a outros embeddings multilíngues (BGE, MiniLM, etc.)
✅ Indexando e respondendo em português Brasil. ✅ Interface web para Consultas
🚀 Resumo da Solução localGPT 2.0⌗
📖 O que é?⌗
Um sistema RAG (Retrieval-Augmented Generation) totalmente local que: ✅ Permite conversar com seus documentos (PDF, TXT, etc.) em português Brasil ✅ Funciona offline com modelos de linguagem locais (Qwen) ✅ Também pode usar modelos da OpenAI (ada-002) se quiser mais qualidade multilíngue
⚙️ Como funciona?⌗
- 📂 Indexa documentos locais:
- Lê seus arquivos em português
- Cria vetores de embeddings (com Qwen ou outro modelo)
- Armazena os vetores em FAISS (local)
- 💬 Responde perguntas:
- Decide se precisa buscar nos documentos ou responder com o conhecimento do modelo
- Recupera trechos relevantes dos documentos
- Gera respostas combinando os trechos com o LLM
- 🌐 Interface Web:
- Você acessa via navegador
- Pode criar índices, fazer consultas e ver resultados
- 🔒 Privacidade total:
- Tudo roda no seu computador
- Nenhum dado é enviado para a nuvem (a menos que você ative o OpenAI)
🧠 Compatibilidade⌗
- Embeddings locais: Qwen (padrão), BGE, MiniLM, etc.
- Embeddings externos: OpenAI ada-002 (opcional)
- Idiomas: Suporte a português Brasil (parcial no Qwen, excelente no ada-002)
🎯 Para que serve?⌗
✅ Fazer perguntas em português sobre seus arquivos (contratos, relatórios, livros, etc.) ✅ Usar IA local sem custos ou dependência de APIs externas ✅ Comparar modelos (Qwen vs OpenAI ada-002) para ver qual responde melhor em português
LocalGPT20 - RAG - PT
1