Documentação de uma arquitetura de IA multiagente onde um…
INEMA
eu ainda posso usar o OAuth do claude e do Codex para nao usar api
Arquitetura de IA Multiagente — Resumo⌗
O documento descreve uma arquitetura de IA multiagente, onde diferentes modelos de IA lidam com diferentes tipos de tarefas, coordenados por um orquestrador central.
A ideia principal é:
Usar o melhor modelo para cada tarefa, em vez de depender de um único modelo.
Isso melhora custo, velocidade e capacidade.
Fluxo do Sistema⌗
As mensagens são recebidas por um bot do Telegram e depois processadas por um orquestrador Ollama, que decide como tratar a solicitação.
Fluxo básico:
Usuário → Bot do Telegram → Orquestrador Ollama → Agente Selecionado → Resposta
Os usuários também podem selecionar um agente explicitamente usando comandos:
/claude
/codex
/ollama
/openrouter
Se nenhum comando for fornecido, o Ollama decide automaticamente qual agente usar.
Papel do Orquestrador Ollama⌗
O Ollama atua como:
1. Roteador (Orquestrador) Analisa a mensagem e decide se deve:
- responder diretamente
- delegar a tarefa para outro agente
2. Agente de IA Local Também pode responder solicitações simples por conta própria.
Isso reduz custos, pois modelos locais são gratuitos, enquanto modelos pagos são usados apenas quando necessário.
Classificação de Tarefas⌗
O orquestrador classifica as solicitações em três tipos:
Tarefas simples⌗
Exemplos:
- perguntas
- conversas
- traduções
→ tratadas diretamente pelo Ollama
Tarefas de código ou ferramentas⌗
Exemplos:
- edição de arquivos
- execução de comandos
- depuração
→ encaminhadas para Codex ou Claude
Tarefas complexas⌗
Exemplos:
- refatoração grande
- deploy
- análise complexa
→ encaminhadas para Claude
Agentes no Sistema⌗
Agente Claude⌗
Comando:
/claude [modelo]
Modelos:
- Opus
- Sonnet
- Haiku
Capacidades:
- execução de bash
- edição de arquivos
- busca na web
- ferramentas avançadas
Limitação: quota de uso.
Codex CLI⌗
Comando:
/codex
Usado principalmente para tarefas automatizadas de programação.
Executa como:
codex --full-auto "mensagem"
Capacidades:
- geração de código
- edição de arquivos
- execução de comandos
Requer:
OPENAI_API_KEY
Ollama (Modelos Locais)⌗
Comando:
/ollama [modelo]
Exemplos:
- qwen2.5-coder
- llama3
- deepseek-coder
Vantagens:
- roda localmente
- custo zero
- rápido
Limitação: não possui ferramentas do sistema.
OpenRouter⌗
Comando:
/openrouter [modelo]
Fornece acesso a múltiplos modelos via API, como:
- DeepSeek
- Mistral
- Claude
Endpoint:
https://openrouter.ai/api/v1/chat/completions
Mecanismo de Roteamento⌗
O orquestrador usa um prompt de classificação e retorna um JSON estruturado:
{"action": "respond", "response": "..."}
ou
{"action": "route", "agent": "claude|codex|openrouter", "instructions": "..."}
Isso permite o roteamento automático entre agentes de IA.
Vantagens dessa Arquitetura⌗
- Menor custo — modelos locais lidam com tarefas simples
- Escalabilidade — novos agentes podem ser adicionados facilmente
- Especialização — cada modelo executa o que faz melhor
- Automação — o sistema escolhe automaticamente o agente ideal
Possíveis Melhorias⌗
Melhorias futuras podem incluir:
Camada de memória⌗
- Redis
- Banco de dados vetorial
- Embeddings
Registro de ferramentas⌗
run_bash
edit_file
deploy_project
Sistemas de planejamento de agentes⌗
agente planejador
agentes executores
agente revisor
Semelhante a arquiteturas usadas em sistemas como AutoGPT, CrewAI ou agentes no estilo Devin.
✅ Conclusão
Essa arquitetura cria um sistema híbrido de IA que combina:
- modelos locais
- APIs externas
- roteamento inteligente
Resultando em um sistema multiagente poderoso, escalável e eficiente em custos.
Arquitetura de MultiAgentes
1