cerebro-vip INEMA.CLUB
inícioINEMA.N8N

Aula prática (ap51) sobre como transformar um agente de IA em…

INEMA.N8N · 2025-07-31 · ~7 min · ver no Telegram ↗

INEMA

dublado

youtube.com/watch ↗

🔥 HACKS ESSENCIAIS

1. Evite Latência com Respostas Inteligentes

  • Ao usar Respond to Webhook, configure timeout máximo na ElevenLabs (ex: 60s).
  • Para respostas longas (como pesquisas), resuma com IA antes de enviar — evite travamentos por tempo de resposta.

Exemplo: Adicione um nó de agente com prompt: "Resuma o conteúdo abaixo em 3 frases curtas para resposta por voz."


2. Customize Vozes com Identidade de Marca

  • Crie uma voz clonada no ElevenLabs com tom e ritmo únicos.
  • Use isso como “voz oficial” do seu projeto ou negócio.

Dica bônus: Grave frases que o personagem/IA costuma dizer, para manter consistência no estilo.


3. Otimize para Telegram (ou outro canal)

  • Ao enviar arquivos de voz no Telegram, use o tipo audio/mp3 e renomeie com extensão .mp3 no campo de metadados do binário.
  • Configure o nó Telegram para “Send Audio”, não “Send File”, para que toque diretamente no chat.

4. Multilinguismo Automático

  • Detecte o idioma no texto transcrito com LangDetect do n8n.
  • Altere dinamicamente o modelo de IA ou a voz com base no idioma.

Exemplo: Se idioma = "pt", use voz “Helena” Se idioma = "en", use voz “Jarvis”


5. Personalidade do Agente com Temperatura e Contexto

  • Use OpenRouter com parâmetros de temperatura (0.8 a 1.2) para torná-lo mais criativo ou divertido.
  • Ajuste o System Prompt para incluir estilo de fala, humor e até vocabulário regional.

6. Crie Agente com “Memória Temporária”

  • Salve as últimas 3 mensagens em uma variável (ex: array no Supabase).
  • Envie para o modelo como contexto (ex: "últimas interações").
  • Dá um ar de continuidade sem manter memória persistente.

7. Censura ou Filtros de Conteúdo

  • Adicione um nó de IF para verificar se há palavras inadequadas na transcrição antes de responder.
  • Use regex ou IA de moderação (como OpenAI Moderation) para bloquear ou redirecionar o fluxo.

8. Rastreamento e Analytics Internos

  • Registre em uma planilha ou banco (ex: Supabase) cada interação com:

  • Tempo de resposta

  • Texto da pergunta
  • Resposta gerada
  • Qual voz foi usada

Permite medir desempenho e ajustar os pontos fracos com base em dados reais.


9. Recursos Locais para Economizar Créditos

  • Faça a transcrição com Whisper localmente (usando outro servidor) para poupar tokens da ElevenLabs.
  • Ou use OpenAI Whisper se já tiver outro uso da API.

10. Experiência de Conversa Natural

  • Adicione uma pausa antes da resposta com setTimeout ou fluxo temporizado no n8n para parecer mais humano.
  • Exemplo: adicionar 2 segundos de delay antes de enviar o áudio.

Abaixo está o passo a passo completo para transformar um agente de IA em um assistente de voz com n8n e ElevenLabs, conforme mostrado no vídeo.


🔧 Parte 1 – Assistente de Voz Simples (Áudio → Texto → IA → Áudio)

1. Entrada: Mensagem de voz via Telegram

  • Crie um trigger de Telegram no n8n: On Message Received.
  • Envie um áudio para o bot via Telegram.
  • O n8n capturará o arquivo (verifique se o tipo é audio/ogg).

2. Baixar o áudio

  • Adicione o nó Telegram → Get File.
  • Use o file_id da mensagem anterior para baixar o áudio.
  • O arquivo estará em formato binário.

3. Transcrever o áudio para texto

  • Use o nó ElevenLabs → Transcribe Audio or Video (verifique se está habilitado nos "Community Nodes").
  • Insira sua API Key do ElevenLabs (pode ser plano gratuito ou pago).
  • Aponte o campo data para o binário do áudio baixado.

4. Enviar a transcrição para o agente de IA

  • Adicione um nó de agente de IA (pode ser do próprio n8n ou OpenRouter).
  • Configure o system prompt com uma personalidade, ex: “Você é um assistente útil e engraçado”.
  • Use o texto transcrito como mensagem de entrada.

5. Converter a resposta do agente em áudio

  • Adicione o nó ElevenLabs → Text to Speech.
  • Escolha uma voz existente ou cole um Voice ID personalizado da ElevenLabs.
  • Use o texto gerado pelo agente como entrada.

6. Enviar o áudio de volta pelo Telegram

  • Adicione o nó Telegram → Send Audio.
  • Pegue o chat_id da mensagem original.
  • Aponte o campo binário de áudio gerado (campo data) como conteúdo a ser enviado.

🧠 Parte 2 – Agente de Voz Conversacional em Tempo Real (com ElevenLabs)

1. Criar agente conversacional na ElevenLabs

  • Vá para a aba Agents na ElevenLabs.
  • Crie um novo agente com nome, tom e mensagem inicial.
  • Defina o idioma e a voz desejada.
  • Crie um Tool Calling com um Webhook (POST) apontando para o n8n.

2. No n8n: Criar o Webhook

  • Adicione um nó Webhook (POST) no n8n.
  • Copie a URL gerada e cole no campo do Tool Calling da ElevenLabs.
  • Configure o corpo da requisição para aceitar algo como searchQuery.

3. Realizar a busca com IA externa (ex: Perplexity)

  • Adicione o nó Perplexity → Message Model.
  • Use o texto do campo searchQuery recebido pelo webhook.
  • Retorne um texto mais objetivo e resumido.

4. Resumir a resposta (opcional)

  • Adicione um agente de IA para resumir a resposta vinda do Perplexity.
  • System prompt: “Você é um agente de pesquisa que resume em 3 frases”.

5. Responder ao agente de voz

  • Use o nó Respond to Webhook.
  • Envie a resposta final de volta para o agente ElevenLabs.

🔐 Ativação e Produção

Trocar o Webhook de Teste pelo de Produção:

  • Ao finalizar os testes, ative o workflow no n8n.
  • Copie o novo Webhook de produção (sem /test) e substitua no agente da ElevenLabs.

🎯 Dicas finais

  • Use OpenRouter como backend para os agentes de IA se quiser personalizar modelos.
  • Para vozes no ElevenLabs, você pode pré-visualizar ou clonar vozes e usar seus IDs.
  • O modelo completo pode ser baixado na comunidade gratuita do criador.

Resumo do vídeo "Transforme seu agente de IA em um assistente de voz em minutos (n8n e ElevenLabs)"

O vídeo apresenta duas maneiras práticas de transformar um agente de IA em um assistente de voz, utilizando n8n e ElevenLabs, sem a necessidade de programação.


Parte 1 – Agente com Resposta por Áudio (não conversacional)

  1. Fluxo básico com n8n + Telegram + ElevenLabs:
  • O usuário envia um áudio via Telegram.
  • O n8n capta e baixa o arquivo.
  • O áudio é transcrito via ElevenLabs (ou OpenAI).
  • A transcrição é enviada para um agente de IA que gera uma resposta em texto.
  • A resposta é convertida em áudio usando ElevenLabs (Text to Speech).
  • O áudio gerado é enviado de volta ao Telegram como arquivo de voz.
  1. Recursos envolvidos:
  • Nodes do Telegram, ElevenLabs e AI Agent.
  • Chaves de API para ElevenLabs e OpenRouter.
  • Configuração do agente com prompts personalizados e escolha de voz.

Parte 2 – Agente de Voz Conversacional em Tempo Real (ElevenLabs)

  1. Criação de um agente conversacional direto na ElevenLabs:
  • Agente recebe e responde por voz de forma contínua.
  • É criado um webhook personalizado no n8n, que recebe dados do agente ElevenLabs.
  • ElevenLabs envia a solicitação (por voz) ao webhook.
  • O n8n consulta fontes (ex: Perplexity.ai) e retorna um resumo para o agente responder.
  1. Integração avançada com ferramenta de pesquisa:
  • ElevenLabs extrai a intenção do usuário (ex: "pesquisar diferenças entre cães e gatos").
  • n8n executa a busca e resume os resultados com outro agente de IA.
  • A resposta final é enviada de volta à ElevenLabs como áudio.

Destaques e boas práticas:

  • Utilização de dois modos: simples (voz para voz) e conversacional (com busca e resposta).
  • Criação de ferramentas personalizadas (tool calling) no painel de agentes da ElevenLabs.
  • Importância de trocar a URL do webhook de teste pela de produção ao ativar o fluxo.
  • Uso de modelos como Perplexity, OpenRouter, e ElevenLabs com API key.

Conclusão:

O vídeo ensina de forma prática como adicionar voz aos agentes de IA usando n8n e ElevenLabs, criando uma experiência mais interativa e natural. É possível baixar o workflow completo na comunidade gratuita do autor ou participar da comunidade paga com cursos avançados sobre automações com IA.


Exemplos demonstrados:

  • Conversão de áudio enviado no Telegram em resposta falada.
  • Pesquisa sobre Nvidia Q4 2025 e diferenças entre cães e gatos, respondidas por agente de voz com personalidade.

Transforme seu Agente de IA em um Assistente de Voz em Minutos (n8n & ElevenLabs)

Já quis que seu agente de IA respondesse com voz? Neste vídeo, eu mostro como criar um agente de IA com voz no n8n usando o ElevenLabs, capaz de responder com arquivos de áudio ou manter conversas em tempo real.

Não é necessário programar — basta configurar uma chamada de API ou um webhook simples.

Aqui todo o processo passo a passo para que você possa acompanhar e colocar seu próprio agente de IA com voz em funcionamento em poucos minutos.

tem instalar os nodes do Elevenlabs

ap51 - Agente de Voz

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗