Tópico sobre construção de um sistema de agentes n8n que escolhe…

INEMA

youtube.com/watch ↗

Dicas

1. Use IA de forma estratégica para economizar⌗

Dica: Não use sempre o mesmo modelo. Tarefas simples não precisam de modelos caros.
Exemplo: Use Gemini Flash para respostas curtas ou piadas. Use Claude Sonnet ou GPT-4 Mini apenas quando necessário.

2. Crie um Agente Selecionador de Modelos⌗

Dica: Tenha um agente inicial que avalia a tarefa e escolhe o modelo ideal.
Exemplo: Se a pergunta for "qual o horário do almoço?", use um modelo leve. Se for "faça uma análise sobre o impacto da IA no varejo", use um modelo avançado.

3. Integre Slack ou outro mensageiro para comunicação natural⌗

Dica: Use Slack (ou Telegram) como interface de entrada e saída para falar com seus agentes.
Exemplo: Digite “crie um evento de almoço às 13h” e receba o evento criado automaticamente no Slack.

4. Monitore o uso e custo de cada modelo⌗

Dica: Use o OpenRouter para ver qual modelo foi usado, o custo e os tokens consumidos.
Exemplo: Depois de 1 semana, veja quais modelos mais foram utilizados e otimize.

5. Automatize respostas com memória e logs⌗

Dica: Grave os inputs, outputs e modelos usados em um Google Sheet ou banco de dados.
Exemplo: Isso permite analisar padrões e melhorar os prompts ou lógica de decisão.

6. Combine IA com ferramentas externas (Tavily, Supabase, etc.)⌗

Dica: Permita que a IA use ferramentas externas para buscar informações (web search) ou consultar dados locais.
Exemplo: IA pesquisa “tendências de agentes de voz em 2025” e monta um artigo completo.

7. Use RAG com modelos variáveis⌗

Dica: Até no RAG (Retrieval-Augmented Generation), adapte o modelo ao tipo de pergunta.
Exemplo: Perguntas simples sobre política de entrega usam GPT-4 Mini. Comparações complexas entre políticas usam Claude.

8. Prepare o sistema para escalar com novas IAs⌗

Dica: Configure o fluxo para que novos modelos sejam adicionados com facilidade.
Exemplo: Quando surgir um novo modelo rápido e barato, basta adicionar no seletor com sua especialidade.

9. Evite a função “/auto” do OpenRouter⌗

Dica: Ela escolhe sozinha, mas não permite controle ou estratégia de custo/desempenho.
Exemplo: Prefira sua própria lógica de seleção baseada no tipo de tarefa.

Aqui está o passo a passo direto para criar o sistema onde o agente de IA escolhe automaticamente o melhor modelo com base na tarefa, usando n8n + OpenRouter + Slack + (opcionalmente) Supabase:

1. Configurar o Slack⌗

Crie um bot no Slack e gere um webhook de entrada.
No n8n, adicione um gatilho HTTP ou Slack Trigger para receber mensagens.

2. Criar o Agente Selecionador de Modelo⌗

Adicione um nó OpenAI (ou outro LLM via OpenRouter).
Prompt do sistema: ``` Você é um agente responsável por escolher o melhor modelo de IA com base na tarefa enviada. Escolha um dos seguintes:
gemini-pro: para tarefas simples
gpt-4-mini: tarefas médias
claude-3-sonnet: tarefas complexas e longas
openai-01: raciocínio lógico Retorne apenas o nome do modelo. ```
Entrada do usuário: passe a mensagem recebida do Slack.
Saída: nome do modelo (limpe espaços e quebras de linha com um nó “Set” ou “Function”).

3. Criar o Agente Executor da Tarefa⌗

- Adicione outro nó OpenAI, Claude ou Gemini via OpenRouter. - Use uma variável para o nome do modelo, vindo do passo anterior. - Passe a mensagem original como entrada para esse modelo.

4. Responder no Slack⌗

- Adicione um nó Slack - Post Message. - Envie a resposta gerada pelo modelo de volta para o canal original.

5. (Opcional) Logar tudo no Google Sheets ou Supabase⌗

Crie uma planilha com colunas: input, output, modelo, data/hora.
Use os nós correspondentes para gravar os dados após cada execução.

6. Testar o Fluxo⌗

Mande mensagens simples e complexas no Slack.
Verifique se o sistema escolhe modelos diferentes conforme a tarefa.

7. (Extra) Comparar Modelos⌗

"Este agente de IA escolhe seu próprio cérebro (10x mais barato, n8n)":

Um sistema de agentes de IA integrados ao n8n que escolhem dinamicamente o modelo de linguagem ideal (como Claude, GPT-4 Mini ou Gemini Flash) com base na complexidade da tarefa, otimizando custo e desempenho.

Estrutura do sistema:⌗

Entrada via Slack: Usuário envia mensagens no Slack.
Agente Selecionador de Modelo: - Analisa o texto enviado. - Escolhe o modelo ideal entre os disponíveis no OpenRouter com base na tarefa. - Modelos usados: Gemini 2.0 Flash (leve e grátis), GPT-4.1 Mini, Claude 3.7 Sonnet, OpenAI 01 (raciocínio).
Execução pelo Agente Principal: - Usa o modelo escolhido para responder à solicitação (como piadas, eventos no calendário, pesquisas complexas). - Responde no Slack e registra entrada, saída e modelo utilizado.
Aplicações mostradas: - Criar eventos no calendário. - Gerar posts de blog com pesquisas detalhadas via Tavily. - Consultar políticas em uma base RAG no Supabase (FAQ e políticas de empresa).
Controle de custos: - Evita uso de modelos caros para tarefas simples. - Visualização de logs e custos no OpenRouter.

Ferramentas utilizadas:⌗

n8n para automação do fluxo.
Slack como interface de entrada e resposta.
OpenRouter para roteamento inteligente entre mais de 300 modelos.
Supabase como base vetorial para RAG.
Tavily para pesquisa web.
Google Sheets para log dos dados.

Benefícios:⌗

Redução drástica de custos com tokens.
Escolha automática do melhor modelo.
Sistema adaptável e eficiente.

Extras:⌗

Oferece o fluxo JSON para download.
Demonstra o uso de ferramentas de comparação como Vellum e LLM Arena para avaliar modelos LLM.

ap19 - Agente com Cerebro

chatgpt.com ↗