Tutorial completo para montar o localGPT 2.0 com suporte a português…

INEMA

youtube.com/watch ↗

github.com ↗

A versão 2.0 está em um branch separado (localgpt-v2) dentro desse mesmo repositório. Ou seja:

📂 Branch: localgpt-v2
📦 Não está na branch principal (main).

🔗 github.com/PromtEngineer/localGPT ↗

Instalar Python 3.10+ e pip
Instalar NodeJS e npm
Instalar Git
Instalar Ollama
Clonar repositório do localGPT v2
Criar ambiente virtual
Instalar dependências Python
Instalar dependências frontend
Baixar Qwen Embedding
Configurar OpenAI ada-002 (opcional)
Adicionar outro embedding multilíngue (opcional)
Criar pasta documents e adicionar arquivos
Rodar backend
Rodar frontend
Criar índice com opções avançadas
Fazer perguntas em português
Alternar entre Qwen e ada-002 para comparar

🎁 Bônus: Melhorias⌗

Pode trocar FAISS por PostgreSQL + pgvector para gerenciar vetores e metadados juntos.
Pode adicionar Vision OCR para PDFs escaneados.
Pode integrar LangChain para fluxos mais complexos.

Um passo a passo completo e detalhado para montar o localGPT 2.0 com suporte total a português Brasil, rodando localmente com:

✅ Qwen Embedding (padrão)
✅ OpenAI ada-002 (opcional para comparar)
✅ E compatível com outros embeddings multilíngues (ex: BGE, MiniLM)

Tudo pronto para:

📂 Indexar documentos (PDF, TXT) em português
💬 Perguntar em português
🔒 100% local (ou com API OpenAI se quiser usar ada-002)

🏆 Solução Completa: localGPT 2.0 com PT-BR⌗

Organizado em 6 fases, cada uma com comandos e explicações.

🔥 FASE 1: Preparar o ambiente⌗

1️⃣ Instalar dependências principais⌗

Python 3.10+ e pip⌗

Linux:

sudo apt update sudo apt install python3 python3-pip python3-venv -y

Windows/Mac:

Baixar Python 3.10+ em https://www.python.org/downloads/
Durante instalação, marcar “Add Python to PATH”

NodeJS e npm⌗

Linux:

sudo apt install nodejs npm -y

Windows/Mac:

Baixar em https://nodejs.org/en/download

Git⌗

sudo apt install git -y # Linux

Windows: Baixar Git for Windows https://git-scm.com/download/win

2️⃣ Instalar Ollama (para rodar Qwen localmente)⌗

curl https://ollama.com/install.sh | sh # Linux/Mac

Windows: Baixar instalador https://ollama.com/download

📦 FASE 2: Clonar e configurar o localGPT 2.0⌗

3️⃣ Clonar repositório do localGPT v2⌗

git clone -b localgpt-v2 https://github.com/PromtEngineer/localGPT.git cd localGPT

4️⃣ Criar ambiente virtual⌗

python3 -m venv venv source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows

5️⃣ Instalar dependências Python⌗

pip install -r requirements.txt

6️⃣ Instalar dependências frontend⌗

npm install

🧠 FASE 3: Configurar embeddings multilíngues⌗

7️⃣ Baixar Qwen Embedding⌗

ollama pull qwen:7b

8️⃣ (Opcional) Configurar OpenAI ada-002⌗

Criar arquivo .env na raiz do projeto:

OPENAI_API_KEY=sk-XXXXXXXXXXXXXXXXXXXXXX

Alterar backend para usar OpenAI:

from langchain.embeddings import OpenAIEmbeddings embeddings = OpenAIEmbeddings()

9️⃣ (Opcional) Adicionar outro embedding multilíngue⌗

Exemplo com BGE-Large (ótimo para PT-BR):

ollama pull BAAI/bge-large-en-v1.5

Depois configure o localGPT para apontar para ele.

📂 FASE 4: Adicionar documentos⌗

🔟 Colocar arquivos em português⌗

Crie a pasta documents:

mkdir documents

Adicione seus PDFs/TXT em português aqui:

localGPT/documents/contrato1.pdf localGPT/documents/relatorio-saude-brasil.txt

⚙️ FASE 5: Rodar o localGPT⌗

1️⃣1️⃣ Iniciar backend⌗

p```ython backend_server.py

---

### 1️⃣2️⃣ Iniciar frontend

Em outro terminal:

n```pm run dev

Acesse no navegador: http://localhost:3000

💬 FASE 6: Usar em português Brasil⌗

✅ Crie o índice:⌗

Selecione High Recall Chunking *** Ative Contextual Retrieval *** Escolha Hybrid Search para combinar dense e full-text.

✅ Faça perguntas em PT-BR:⌗

Exemplos:

“Quais são as vantagens da inteligência artificial na saúde pública brasileira?”
“Liste exemplos de uso de IA no SUS.”

🏎️ Comparar embeddings⌗

🔄 Alternar entre Qwen e ada-002⌗

Use Qwen (padrão) e faça perguntas.
Alterne para ada-002 no backend e refaça as mesmas perguntas.
Observe diferenças de entendimento (Qwen pode falhar em gírias ou termos culturais brasileiros, ada-002 acerta mais).

📌 Resultado final⌗

✅ localGPT 2.0 rodando localmente com:

Qwen Embedding (offline e gratuito)
OpenAI ada-002 (online e pago, mas com suporte PT-BR superior)
Suporte a outros embeddings multilíngues (BGE, MiniLM, etc.)

✅ Indexando e respondendo em português Brasil. ✅ Interface web para Consultas

🚀 Resumo da Solução localGPT 2.0⌗

📖 O que é?⌗

Um sistema RAG (Retrieval-Augmented Generation) totalmente local que: ✅ Permite conversar com seus documentos (PDF, TXT, etc.) em português Brasil ✅ Funciona offline com modelos de linguagem locais (Qwen) ✅ Também pode usar modelos da OpenAI (ada-002) se quiser mais qualidade multilíngue

⚙️ Como funciona?⌗

📂 Indexa documentos locais:

Lê seus arquivos em português
Cria vetores de embeddings (com Qwen ou outro modelo)
Armazena os vetores em FAISS (local)

💬 Responde perguntas:

Decide se precisa buscar nos documentos ou responder com o conhecimento do modelo
Recupera trechos relevantes dos documentos
Gera respostas combinando os trechos com o LLM

🌐 Interface Web:

Você acessa via navegador
Pode criar índices, fazer consultas e ver resultados

🔒 Privacidade total:

Tudo roda no seu computador
Nenhum dado é enviado para a nuvem (a menos que você ative o OpenAI)

🧠 Compatibilidade⌗

Embeddings locais: Qwen (padrão), BGE, MiniLM, etc.
Embeddings externos: OpenAI ada-002 (opcional)
Idiomas: Suporte a português Brasil (parcial no Qwen, excelente no ada-002)

🎯 Para que serve?⌗

✅ Fazer perguntas em português sobre seus arquivos (contratos, relatórios, livros, etc.) ✅ Usar IA local sem custos ou dependência de APIs externas ✅ Comparar modelos (Qwen vs OpenAI ada-002) para ver qual responde melhor em português

LocalGPT20 - RAG - PT

chatgpt.com ↗