Aula prática (ap51) sobre como transformar um agente de IA em…
INEMA
dublado
🔥 HACKS ESSENCIAIS⌗
1. Evite Latência com Respostas Inteligentes⌗
- Ao usar
Respond to Webhook, configuretimeoutmáximo na ElevenLabs (ex: 60s). - Para respostas longas (como pesquisas), resuma com IA antes de enviar — evite travamentos por tempo de resposta.
Exemplo: Adicione um nó de agente com prompt: "Resuma o conteúdo abaixo em 3 frases curtas para resposta por voz."
2. Customize Vozes com Identidade de Marca⌗
- Crie uma voz clonada no ElevenLabs com tom e ritmo únicos.
- Use isso como “voz oficial” do seu projeto ou negócio.
Dica bônus: Grave frases que o personagem/IA costuma dizer, para manter consistência no estilo.
3. Otimize para Telegram (ou outro canal)⌗
- Ao enviar arquivos de voz no Telegram, use o tipo audio/mp3 e renomeie com extensão
.mp3no campo de metadados do binário. - Configure o nó Telegram para “Send Audio”, não “Send File”, para que toque diretamente no chat.
4. Multilinguismo Automático⌗
- Detecte o idioma no texto transcrito com
LangDetectdo n8n. - Altere dinamicamente o modelo de IA ou a voz com base no idioma.
Exemplo: Se idioma = "pt", use voz “Helena” Se idioma = "en", use voz “Jarvis”
5. Personalidade do Agente com Temperatura e Contexto⌗
- Use OpenRouter com parâmetros de temperatura (0.8 a 1.2) para torná-lo mais criativo ou divertido.
- Ajuste o System Prompt para incluir estilo de fala, humor e até vocabulário regional.
6. Crie Agente com “Memória Temporária”⌗
- Salve as últimas 3 mensagens em uma variável (ex: array no Supabase).
- Envie para o modelo como contexto (ex: "últimas interações").
- Dá um ar de continuidade sem manter memória persistente.
7. Censura ou Filtros de Conteúdo⌗
- Adicione um nó de
IFpara verificar se há palavras inadequadas na transcrição antes de responder. - Use regex ou IA de moderação (como OpenAI
Moderation) para bloquear ou redirecionar o fluxo.
8. Rastreamento e Analytics Internos⌗
-
Registre em uma planilha ou banco (ex: Supabase) cada interação com:
-
Tempo de resposta
- Texto da pergunta
- Resposta gerada
- Qual voz foi usada
Permite medir desempenho e ajustar os pontos fracos com base em dados reais.
9. Recursos Locais para Economizar Créditos⌗
- Faça a transcrição com Whisper localmente (usando outro servidor) para poupar tokens da ElevenLabs.
- Ou use
OpenAI Whisperse já tiver outro uso da API.
10. Experiência de Conversa Natural⌗
- Adicione uma pausa antes da resposta com
setTimeoutou fluxo temporizado no n8n para parecer mais humano. - Exemplo: adicionar 2 segundos de delay antes de enviar o áudio.
Abaixo está o passo a passo completo para transformar um agente de IA em um assistente de voz com n8n e ElevenLabs, conforme mostrado no vídeo.
🔧 Parte 1 – Assistente de Voz Simples (Áudio → Texto → IA → Áudio)⌗
1. Entrada: Mensagem de voz via Telegram⌗
- Crie um trigger de Telegram no n8n:
On Message Received. - Envie um áudio para o bot via Telegram.
- O n8n capturará o arquivo (verifique se o tipo é
audio/ogg).
2. Baixar o áudio⌗
- Adicione o nó
Telegram → Get File. - Use o
file_idda mensagem anterior para baixar o áudio. - O arquivo estará em formato binário.
3. Transcrever o áudio para texto⌗
- Use o nó ElevenLabs → Transcribe Audio or Video (verifique se está habilitado nos "Community Nodes").
- Insira sua API Key do ElevenLabs (pode ser plano gratuito ou pago).
- Aponte o campo
datapara o binário do áudio baixado.
4. Enviar a transcrição para o agente de IA⌗
- Adicione um nó de agente de IA (pode ser do próprio n8n ou OpenRouter).
- Configure o system prompt com uma personalidade, ex: “Você é um assistente útil e engraçado”.
- Use o texto transcrito como mensagem de entrada.
5. Converter a resposta do agente em áudio⌗
- Adicione o nó
ElevenLabs → Text to Speech. - Escolha uma voz existente ou cole um Voice ID personalizado da ElevenLabs.
- Use o texto gerado pelo agente como entrada.
6. Enviar o áudio de volta pelo Telegram⌗
- Adicione o nó
Telegram → Send Audio. - Pegue o
chat_idda mensagem original. - Aponte o campo binário de áudio gerado (campo
data) como conteúdo a ser enviado.
🧠 Parte 2 – Agente de Voz Conversacional em Tempo Real (com ElevenLabs)⌗
1. Criar agente conversacional na ElevenLabs⌗
- Vá para a aba Agents na ElevenLabs.
- Crie um novo agente com nome, tom e mensagem inicial.
- Defina o idioma e a voz desejada.
- Crie um Tool Calling com um Webhook (POST) apontando para o n8n.
2. No n8n: Criar o Webhook⌗
- Adicione um nó
Webhook (POST)no n8n. - Copie a URL gerada e cole no campo do Tool Calling da ElevenLabs.
- Configure o corpo da requisição para aceitar algo como
searchQuery.
3. Realizar a busca com IA externa (ex: Perplexity)⌗
- Adicione o nó
Perplexity → Message Model. - Use o texto do campo
searchQueryrecebido pelo webhook. - Retorne um texto mais objetivo e resumido.
4. Resumir a resposta (opcional)⌗
- Adicione um agente de IA para resumir a resposta vinda do Perplexity.
- System prompt: “Você é um agente de pesquisa que resume em 3 frases”.
5. Responder ao agente de voz⌗
- Use o nó
Respond to Webhook. - Envie a resposta final de volta para o agente ElevenLabs.
🔐 Ativação e Produção⌗
Trocar o Webhook de Teste pelo de Produção:⌗
- Ao finalizar os testes, ative o workflow no n8n.
- Copie o novo Webhook de produção (sem
/test) e substitua no agente da ElevenLabs.
🎯 Dicas finais⌗
- Use OpenRouter como backend para os agentes de IA se quiser personalizar modelos.
- Para vozes no ElevenLabs, você pode pré-visualizar ou clonar vozes e usar seus IDs.
- O modelo completo pode ser baixado na comunidade gratuita do criador.
Resumo do vídeo "Transforme seu agente de IA em um assistente de voz em minutos (n8n e ElevenLabs)"
O vídeo apresenta duas maneiras práticas de transformar um agente de IA em um assistente de voz, utilizando n8n e ElevenLabs, sem a necessidade de programação.
Parte 1 – Agente com Resposta por Áudio (não conversacional)⌗
- Fluxo básico com n8n + Telegram + ElevenLabs:
- O usuário envia um áudio via Telegram.
- O n8n capta e baixa o arquivo.
- O áudio é transcrito via ElevenLabs (ou OpenAI).
- A transcrição é enviada para um agente de IA que gera uma resposta em texto.
- A resposta é convertida em áudio usando ElevenLabs (Text to Speech).
- O áudio gerado é enviado de volta ao Telegram como arquivo de voz.
- Recursos envolvidos:
- Nodes do Telegram, ElevenLabs e AI Agent.
- Chaves de API para ElevenLabs e OpenRouter.
- Configuração do agente com prompts personalizados e escolha de voz.
Parte 2 – Agente de Voz Conversacional em Tempo Real (ElevenLabs)⌗
- Criação de um agente conversacional direto na ElevenLabs:
- Agente recebe e responde por voz de forma contínua.
- É criado um webhook personalizado no n8n, que recebe dados do agente ElevenLabs.
- ElevenLabs envia a solicitação (por voz) ao webhook.
- O n8n consulta fontes (ex: Perplexity.ai) e retorna um resumo para o agente responder.
- Integração avançada com ferramenta de pesquisa:
- ElevenLabs extrai a intenção do usuário (ex: "pesquisar diferenças entre cães e gatos").
- n8n executa a busca e resume os resultados com outro agente de IA.
- A resposta final é enviada de volta à ElevenLabs como áudio.
Destaques e boas práticas:⌗
- Utilização de dois modos: simples (voz para voz) e conversacional (com busca e resposta).
- Criação de ferramentas personalizadas (tool calling) no painel de agentes da ElevenLabs.
- Importância de trocar a URL do webhook de teste pela de produção ao ativar o fluxo.
- Uso de modelos como Perplexity, OpenRouter, e ElevenLabs com API key.
Conclusão:⌗
O vídeo ensina de forma prática como adicionar voz aos agentes de IA usando n8n e ElevenLabs, criando uma experiência mais interativa e natural. É possível baixar o workflow completo na comunidade gratuita do autor ou participar da comunidade paga com cursos avançados sobre automações com IA.
Exemplos demonstrados:
- Conversão de áudio enviado no Telegram em resposta falada.
- Pesquisa sobre Nvidia Q4 2025 e diferenças entre cães e gatos, respondidas por agente de voz com personalidade.
Transforme seu Agente de IA em um Assistente de Voz em Minutos (n8n & ElevenLabs)
Já quis que seu agente de IA respondesse com voz? Neste vídeo, eu mostro como criar um agente de IA com voz no n8n usando o ElevenLabs, capaz de responder com arquivos de áudio ou manter conversas em tempo real.
Não é necessário programar — basta configurar uma chamada de API ou um webhook simples.
Aqui todo o processo passo a passo para que você possa acompanhar e colocar seu próprio agente de IA com voz em funcionamento em poucos minutos.
tem instalar os nodes do Elevenlabs
ap51 - Agente de Voz
1