Tópico sobre construção de um sistema de agentes n8n que escolhe…
INEMA
Dicas
1. Use IA de forma estratégica para economizar⌗
- Dica: Não use sempre o mesmo modelo. Tarefas simples não precisam de modelos caros.
- Exemplo: Use Gemini Flash para respostas curtas ou piadas. Use Claude Sonnet ou GPT-4 Mini apenas quando necessário.
2. Crie um Agente Selecionador de Modelos⌗
- Dica: Tenha um agente inicial que avalia a tarefa e escolhe o modelo ideal.
- Exemplo: Se a pergunta for "qual o horário do almoço?", use um modelo leve. Se for "faça uma análise sobre o impacto da IA no varejo", use um modelo avançado.
3. Integre Slack ou outro mensageiro para comunicação natural⌗
- Dica: Use Slack (ou Telegram) como interface de entrada e saída para falar com seus agentes.
- Exemplo: Digite “crie um evento de almoço às 13h” e receba o evento criado automaticamente no Slack.
4. Monitore o uso e custo de cada modelo⌗
- Dica: Use o OpenRouter para ver qual modelo foi usado, o custo e os tokens consumidos.
- Exemplo: Depois de 1 semana, veja quais modelos mais foram utilizados e otimize.
5. Automatize respostas com memória e logs⌗
- Dica: Grave os inputs, outputs e modelos usados em um Google Sheet ou banco de dados.
- Exemplo: Isso permite analisar padrões e melhorar os prompts ou lógica de decisão.
6. Combine IA com ferramentas externas (Tavily, Supabase, etc.)⌗
- Dica: Permita que a IA use ferramentas externas para buscar informações (web search) ou consultar dados locais.
- Exemplo: IA pesquisa “tendências de agentes de voz em 2025” e monta um artigo completo.
7. Use RAG com modelos variáveis⌗
- Dica: Até no RAG (Retrieval-Augmented Generation), adapte o modelo ao tipo de pergunta.
- Exemplo: Perguntas simples sobre política de entrega usam GPT-4 Mini. Comparações complexas entre políticas usam Claude.
8. Prepare o sistema para escalar com novas IAs⌗
- Dica: Configure o fluxo para que novos modelos sejam adicionados com facilidade.
- Exemplo: Quando surgir um novo modelo rápido e barato, basta adicionar no seletor com sua especialidade.
9. Evite a função “/auto” do OpenRouter⌗
- Dica: Ela escolhe sozinha, mas não permite controle ou estratégia de custo/desempenho.
- Exemplo: Prefira sua própria lógica de seleção baseada no tipo de tarefa.
Aqui está o passo a passo direto para criar o sistema onde o agente de IA escolhe automaticamente o melhor modelo com base na tarefa, usando n8n + OpenRouter + Slack + (opcionalmente) Supabase:
1. Configurar o Slack⌗
- Crie um bot no Slack e gere um webhook de entrada.
- No n8n, adicione um gatilho HTTP ou Slack Trigger para receber mensagens.
2. Criar o Agente Selecionador de Modelo⌗
- Adicione um nó OpenAI (ou outro LLM via OpenRouter).
- Prompt do sistema: ``` Você é um agente responsável por escolher o melhor modelo de IA com base na tarefa enviada. Escolha um dos seguintes:
- gemini-pro: para tarefas simples
- gpt-4-mini: tarefas médias
- claude-3-sonnet: tarefas complexas e longas
- openai-01: raciocínio lógico Retorne apenas o nome do modelo. ```
- Entrada do usuário: passe a mensagem recebida do Slack.
- Saída: nome do modelo (limpe espaços e quebras de linha com um nó “Set” ou “Function”).
3. Criar o Agente Executor da Tarefa⌗
- Adicione outro nó OpenAI, Claude ou Gemini via OpenRouter. - Use uma variável para o nome do modelo, vindo do passo anterior. - Passe a mensagem original como entrada para esse modelo.
4. Responder no Slack⌗
- Adicione um nó Slack - Post Message. - Envie a resposta gerada pelo modelo de volta para o canal original.
5. (Opcional) Logar tudo no Google Sheets ou Supabase⌗
- Crie uma planilha com colunas: input, output, modelo, data/hora.
- Use os nós correspondentes para gravar os dados após cada execução.
6. Testar o Fluxo⌗
- Mande mensagens simples e complexas no Slack.
- Verifique se o sistema escolhe modelos diferentes conforme a tarefa.
7. (Extra) Comparar Modelos⌗
- Use sites como:
- vellum.ai/labs/leaderboard ↗
- lmarena.org ↗
"Este agente de IA escolhe seu próprio cérebro (10x mais barato, n8n)":
Um sistema de agentes de IA integrados ao n8n que escolhem dinamicamente o modelo de linguagem ideal (como Claude, GPT-4 Mini ou Gemini Flash) com base na complexidade da tarefa, otimizando custo e desempenho.
Estrutura do sistema:⌗
- Entrada via Slack: Usuário envia mensagens no Slack.
- Agente Selecionador de Modelo: - Analisa o texto enviado. - Escolhe o modelo ideal entre os disponíveis no OpenRouter com base na tarefa. - Modelos usados: Gemini 2.0 Flash (leve e grátis), GPT-4.1 Mini, Claude 3.7 Sonnet, OpenAI 01 (raciocínio).
- Execução pelo Agente Principal: - Usa o modelo escolhido para responder à solicitação (como piadas, eventos no calendário, pesquisas complexas). - Responde no Slack e registra entrada, saída e modelo utilizado.
- Aplicações mostradas: - Criar eventos no calendário. - Gerar posts de blog com pesquisas detalhadas via Tavily. - Consultar políticas em uma base RAG no Supabase (FAQ e políticas de empresa).
- Controle de custos: - Evita uso de modelos caros para tarefas simples. - Visualização de logs e custos no OpenRouter.
Ferramentas utilizadas:⌗
- n8n para automação do fluxo.
- Slack como interface de entrada e resposta.
- OpenRouter para roteamento inteligente entre mais de 300 modelos.
- Supabase como base vetorial para RAG.
- Tavily para pesquisa web.
- Google Sheets para log dos dados.
Benefícios:⌗
- Redução drástica de custos com tokens.
- Escolha automática do melhor modelo.
- Sistema adaptável e eficiente.
Extras:⌗
- Oferece o fluxo JSON para download.
- Demonstra o uso de ferramentas de comparação como Vellum e LLM Arena para avaliar modelos LLM.
ap19 - Agente com Cerebro
1