cerebro-vip INEMA.CLUB
inícioINEMA.DEV Desenvolvimento

Documentação de uma arquitetura de IA multiagente onde um…

INEMA.DEV Desenvolvimento · 2026-03-17 · ~3 min · ver no Telegram ↗

INEMA

eu ainda posso usar o OAuth do claude e do Codex para nao usar api

Arquitetura de IA Multiagente — Resumo

O documento descreve uma arquitetura de IA multiagente, onde diferentes modelos de IA lidam com diferentes tipos de tarefas, coordenados por um orquestrador central.

A ideia principal é:

Usar o melhor modelo para cada tarefa, em vez de depender de um único modelo.

Isso melhora custo, velocidade e capacidade.


Fluxo do Sistema

As mensagens são recebidas por um bot do Telegram e depois processadas por um orquestrador Ollama, que decide como tratar a solicitação.

Fluxo básico:

Usuário → Bot do Telegram → Orquestrador Ollama → Agente Selecionado → Resposta

Os usuários também podem selecionar um agente explicitamente usando comandos:

/claude /codex /ollama /openrouter

Se nenhum comando for fornecido, o Ollama decide automaticamente qual agente usar.


Papel do Orquestrador Ollama

O Ollama atua como:

1. Roteador (Orquestrador) Analisa a mensagem e decide se deve:

  • responder diretamente
  • delegar a tarefa para outro agente

2. Agente de IA Local Também pode responder solicitações simples por conta própria.

Isso reduz custos, pois modelos locais são gratuitos, enquanto modelos pagos são usados apenas quando necessário.


Classificação de Tarefas

O orquestrador classifica as solicitações em três tipos:

Tarefas simples

Exemplos:

  • perguntas
  • conversas
  • traduções

→ tratadas diretamente pelo Ollama


Tarefas de código ou ferramentas

Exemplos:

  • edição de arquivos
  • execução de comandos
  • depuração

→ encaminhadas para Codex ou Claude


Tarefas complexas

Exemplos:

  • refatoração grande
  • deploy
  • análise complexa

→ encaminhadas para Claude


Agentes no Sistema

Agente Claude

Comando:

/claude [modelo]

Modelos:

  • Opus
  • Sonnet
  • Haiku

Capacidades:

  • execução de bash
  • edição de arquivos
  • busca na web
  • ferramentas avançadas

Limitação: quota de uso.


Codex CLI

Comando:

/codex

Usado principalmente para tarefas automatizadas de programação.

Executa como:

codex --full-auto "mensagem"

Capacidades:

  • geração de código
  • edição de arquivos
  • execução de comandos

Requer:

OPENAI_API_KEY


Ollama (Modelos Locais)

Comando:

/ollama [modelo]

Exemplos:

  • qwen2.5-coder
  • llama3
  • deepseek-coder

Vantagens:

  • roda localmente
  • custo zero
  • rápido

Limitação: não possui ferramentas do sistema.


OpenRouter

Comando:

/openrouter [modelo]

Fornece acesso a múltiplos modelos via API, como:

  • DeepSeek
  • Mistral
  • Claude

Endpoint:

https://openrouter.ai/api/v1/chat/completions


Mecanismo de Roteamento

O orquestrador usa um prompt de classificação e retorna um JSON estruturado:

{"action": "respond", "response": "..."}

ou

{"action": "route", "agent": "claude|codex|openrouter", "instructions": "..."}

Isso permite o roteamento automático entre agentes de IA.


Vantagens dessa Arquitetura

  1. Menor custo — modelos locais lidam com tarefas simples
  2. Escalabilidade — novos agentes podem ser adicionados facilmente
  3. Especialização — cada modelo executa o que faz melhor
  4. Automação — o sistema escolhe automaticamente o agente ideal

Possíveis Melhorias

Melhorias futuras podem incluir:

Camada de memória

  • Redis
  • Banco de dados vetorial
  • Embeddings

Registro de ferramentas

run_bash edit_file deploy_project

Sistemas de planejamento de agentes

agente planejador agentes executores agente revisor

Semelhante a arquiteturas usadas em sistemas como AutoGPT, CrewAI ou agentes no estilo Devin.


Conclusão

Essa arquitetura cria um sistema híbrido de IA que combina:

  • modelos locais
  • APIs externas
  • roteamento inteligente

Resultando em um sistema multiagente poderoso, escalável e eficiente em custos.

Arquitetura de MultiAgentes

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗