Resumo de entrevista com Ahmed Mukhtar (47 min) sobre agentes de voz…
INEMA
Aqui estão os principais hacks e dicas práticas compartilhados por Ahmed Mukhtar ao longo da conversa, com exemplos e aplicações específicas:
1. Use N8N como orquestrador modular⌗
Hack: Transforme cada automação em um tool separado dentro do N8N em vez de centralizar tudo em um só agente.
- Por quê: Reduz latência e alucinação em agentes de voz.
- Como aplicar: Configure cada ação (buscar dado, enviar e-mail, marcar horário) como um fluxo próprio no N8N, acessado por tool calling.
- Exemplo: Agente de voz consulta histórico do pet em Supabase → envia ID → N8N retorna dados → agente responde.
2. Evite usar múltiplos agentes em cadeia⌗
Hack: Não envie um comando de um agente de voz para outro agente (ex: agente chamando outro agente via N8N).
- Por quê: Isso gera lentidão e confusão no fluxo.
- Melhor forma: Use o agente de voz como “camada de comunicação” e o N8N como “cérebro modular”.
3. Foque em especializar por nicho⌗
Hack: Crie soluções verticais para áreas específicas (como clínicas, e-commerces, etc).
- Por quê: Especialização reduz concorrência e aumenta o valor percebido.
- Exemplo: Agente de voz com base de dados personalizada para clínicas veterinárias, com histórico de pacientes e agendamentos.
4. Reduza latência com small talk e async⌗
Hack: Em casos com tempo de espera para resposta (tool demorada), insira frases do tipo:
- "Só um segundo, estou verificando essa informação..."
- Ou use plataformas como LiveKit, que permitem continuar a conversa enquanto o dado é processado.
5. Use UltraVox como solução de voz principal⌗
Hack: Escolha UltraVox por:
- Melhor latência
- Suporte multilíngue dinâmico
- Baixo custo
- Suporte a STS e TTS com sotaques
6. Monitore tempo de fala com AI note-takers⌗
Hack: Use ferramentas como Fathom ou Fireflies para monitorar:
- Percentual de fala do cliente vs. seu
- Gravação automática, transcrição e insights
7. Pseudonimização para dados sensíveis⌗
Hack: Ao lidar com dados sensíveis (como em saúde), use pseudonymization:
- Como funciona: Substitui nomes e dados por identificadores antes de enviar ao LLM.
- Exemplo: Nome do paciente →
#1234, e-mail →user@masked.com - Ferramentas: Pode ser implementado com pre-processadores no N8N ou via servidor local com Python.
8. Comece simples, mas pense em sistemas⌗
Hack: Não venda apenas automações pontuais ou arquivos JSON – crie sistemas completos com interface, backend e valor contínuo.
- Exemplo: Criar um dashboard + agentes + relatórios automáticos = solução vendável por assinatura.
9. Utilize conteúdo no YouTube para atrair leads⌗
Hack: Use vídeos mostrando bastidores e cases para atrair clientes qualificados sem fazer cold call.
- Exemplo: Mostre como você criou uma automação de voz para um cliente e os resultados (tempo economizado, redução de custo, etc).
10. Forme equipe com alinhamento de mentalidade⌗
Hack: Escalar exige pessoas com química e mentalidade parecida, não apenas habilidades técnicas.
- Conselho: Trabalhe um tempo sozinho para entender cada função antes de contratar.
Resumo da conversa com Ahmed Mukhtar – 25 de junho (47 min)
Ahmed compartilhou sua trajetória pessoal e profissional, focando em como se especializou em agentes de voz com IA e automações via N8N. A conversa abordou desde suas origens como engenheiro eletrônico até a fundação de sua agência Agents AI. Destacou os desafios iniciais, o papel da comunidade, evolução das ferramentas de voz e lições para escalar negócios com IA.
Principais tópicos abordados:
- Trajetória profissional e transição para IA:
- Formação em engenharia elétrica e trabalho na Rolls-Royce com NLP e grafos de conhecimento.
- Tentativas com micro SaaS até focar em soluções de voz com STT/TTS e LLMs.
- Participação na comunidade de Liam Oatley e início da Agents AI em 2023.
- Especialização em agentes de voz:
- Primeiros testes com Hugging Face e obstáculos com WebSocket.
- Migração para plataformas como VAPI, UltraVox e LiveKit.
- Priorização de UltraVox por oferecer melhor latência, suporte multilíngue e menor custo.
- Casos de uso impactantes:
- Agente de voz para uma rede de clínicas veterinárias no Canadá com integração ao Supabase.
- Automação de agendamentos, histórico médico e lembretes por voz.
- Comparação entre plataformas de voz:
- VAPI/Retail: Fácil, mas caro. Ideal para iniciantes.
- UltraVox: Intermediária, bom custo-benefício, multilinguagem e latência ótima.
- LiveKit: Complexa, escalável, usada pelo OpenAI. Requer backend customizado.
- Integração com N8N:
- Utilizado para conectar agentes de voz com APIs e automações.
- Ajuda a reduzir latência separando as automações por função (cada ferramenta vira um workflow).
- Aplicações como Twilio + UltraVox usando N8N.
- Negócio e vendas:
- Começo difícil sem background em vendas, perdendo os primeiros clientes.
- Evoluiu com a prática, escutando mais e usando provas sociais (cases anteriores).
- Crescimento orgânico com YouTube e construção de autoridade.
- Reforça a importância de construir uma equipe para escalar e de entender cada função antes de contratar.
- Tendências para o futuro dos agentes de voz:
- Expansão do suporte multilíngue.
- Modelos com inteligência emocional (expressão, emoção e contexto).
- Voz como forma natural e escalável de educação personalizada.
- Disrupção na educação com agentes pessoais adaptativos.
- Compliance e segurança:
- Necessidade de adequação à HIPAA (regulação de saúde dos EUA).
- Estratégias como pseudonimização de dados sensíveis antes de enviar ao LLM.
- Possibilidade de uso de modelos locais (como LLaMA 3) para evitar envio de dados a terceiros.
- Dicas para quem quer começar:
- Comece construindo soluções úteis e práticas.
- Construa para clientes reais, colete feedback, itere.
- Automatizações simples estão se tornando comuns – o diferencial será criar sistemas robustos e conectados.
- O maior ROI vem de soluções que crescem com o cliente e automatizam processos-chave do negócio.
Exemplos práticos citados:
- Assistente de voz para TopGolf (consulta e reserva).
- Assistente pessoal para BarkBox (empresa de brinquedos para cães).
- Projeto de agente para pesquisas médicas com HIPAA compliance em GCP.
Conclusão: Ahmed enfatizou que o futuro da IA em voz está na personalização, no domínio de nichos específicos e na combinação com automações robustas. A melhor estratégia para se destacar é construir soluções reais, úteis e integradas, especialmente voltadas para dor e oportunidade de mercado.
Olha um resumo da Entrevista com Ahmed Mukhtar
Sistemas de Voz com ESpecialista
1