Resumo de vídeo tutorial sobre criação de agentes de voz com Vapi e…
INEMA
ChatGPT para gerar ou revisar os system prompts. A técnica é:
“Descreva o papel do meu agente e gere um prompt detalhado para ele.”
E depois:
“Esse foi o resultado. Ele repetiu frases e respondeu devagar. Melhore o prompt para ser mais conciso e responsivo.”
Ou seja, ele usa IA para treinar outra IA — uma forma de meta-prompting.
🎯 5. Mentalidade⌗
A frase-chave dele é:
“Você nunca vai acertar o prompt de primeira. O segredo é testar, ajustar e testar de novo.”
Ele trata o prompt como um documento vivo, que evolui com o agente, os usuários e os fluxos conectados.
🧩 1. Estrutura do System Prompt⌗
Ele usa uma estrutura modular — o prompt é dividido em seções funcionais, cada uma com um propósito claro. A ideia é tratar o prompt como um roteiro de comportamento do agente.
Estrutura sugerida no vídeo:⌗
| Seção | Função |
|---|---|
| Título e propósito | Define quem é o agente e o que ele faz (ex: “Você é um assistente de agendamento para a empresa Green Grass.”) |
| Identidade e papel | Contextualiza a empresa, o tipo de cliente e o objetivo da conversa. |
| Personalidade e tom de voz | Define se o agente é amigável, profissional, empático etc. |
| Fluxo de conversa | Descreve passo a passo como reagir em diferentes situações. Exemplo: – Se o cliente quer agendar → pedir nome, e-mail e data. – Se menciona cancelamento → seguir política de cancelamento. |
| Regras e restrições | O que o agente não deve fazer (ex: “Nunca invente informações.”, “Sempre confirme o e-mail antes de finalizar.”). |
| Ferramentas disponíveis | Lista e descreve os “tools” que o agente pode usar (ex: “use o tool check_availability para ver horários livres”). |
| Notas adicionais | Contexto técnico (fuso horário, formato de data, etc.). |
🧠 2. Técnica Central: Iteração Guiada por Feedback⌗
Ele enfatiza fortemente que não existe prompt perfeito na primeira tentativa. O processo que ele usa é cíclico:
- 🧱 Crie uma primeira versão básica — pode até gerar um rascunho com ChatGPT.
- 🧪 Teste o agente em conversas reais (simulações no dashboard do Vapi).
- 🧾 Observe falhas e comportamentos ruins — respostas incorretas, repetições, falta de contexto, tom errado, etc.
- ✍️ Anote o que funcionou e o que não funcionou.
- 🔁 Volte ao ChatGPT e diga:
“Eu testei esse prompt e ele respondeu X quando deveria responder Y. Melhore o prompt para corrigir isso.” 6. 🧩 Atualize o System Prompt no Vapi e teste novamente.
👉 Ele chama isso implicitamente de “feedback-driven prompt refinement” — uma forma de prompt engineering iterativo baseada em testes práticos.
⚙️ 3. Boas práticas que ele destaca⌗
- Ser extremamente específico em cada cenário: “Se o cliente disser que quer reagendar, pergunte a nova data antes de cancelar.”
- Evitar generalizações (prompts vagos levam a respostas inconsistentes).
- Usar linguagem natural e direta, sem “falar com a IA”, mas instruindo-a como se fosse um funcionário.
- Repetir padrões úteis: se uma parte do diálogo funcionou bem, copie o estilo para outros trechos.
- Adicionar exemplos de fala no prompt (“Se o cliente disser ‘posso remarcar?’, responda…”).
- Controlar temperatura e tokens para manter consistência e custo baixo.
- Iterar sempre que o contexto muda (ex: novo produto, política, ou ferramenta).
💬 4. Ferramenta auxiliar: ChatGPT como “refinador de prompts”⌗
Ele mostra que usa o próprio
e Créditos
- A conta começa com 10 créditos gratuitos;
- Cada chamada consome frações desses créditos;
- Após isso, o modelo é pay-as-you-go (ex: $10 ≈ 18,5 créditos).
📚 Conclusão⌗
O vídeo mostra o ciclo completo de criação de um voice agent:
- Compreensão dos conceitos;
- Criação no Vapi;
- Integração com N8N;
- Testes e ajustes;
- Automação de relatórios;
- (Opcional) Conexão com número de telefone.
O criador ainda convida os interessados a entrarem em sua comunidade paga, que oferece:
- Cursos completos (“Agent Zero”, “10 Hours to 10 Seconds”, “1-Person AI Automation Agency”);
- Chamadas ao vivo semanais;
- Rede de construtores de agentes de IA.
🧾 Resumo Final⌗
| Tema | Descrição |
|---|---|
| Plataformas | Vapi (criação de agentes de voz) + N8N (automação) |
| Componentes principais | STT, LLM, TTS, Prompt, Voz, Ferramentas |
| Casos de uso | Suporte, agendamento, vendas, lembretes |
| Destaque técnico | Integração com Google Calendar, Sheets e e-mails |
| Modelo de negócio | Pay-as-you-go com créditos iniciais grátis |
| Mensagem final | Comece agora, teste e refine — o mercado de voice agents explodirá em 2026 |
🧠 Visão Geral⌗
O vídeo ensina como criar do zero um agente de voz com IA, mostrando o uso prático das plataformas Vapi (Vappy) e N8N (Nadn). O objetivo é que, ao final, o espectador entenda:
- O valor e funcionamento dos agentes de voz;
- Como configurar um agente funcional;
- E como integrá-lo com ferramentas e automações.
🔍 O que são Voice Agents?⌗
Um voice agent é um assistente virtual que interage por voz em tempo real, via telefone ou site. Difere de um chatbot por usar fala e áudio, mas internamente funciona igual:
- Speech-to-Text (STT): converte a fala do usuário em texto;
- Large Language Model (LLM): processa e gera uma resposta;
- Text-to-Speech (TTS): transforma a resposta em áudio.
Esses agentes podem agendar compromissos, atender clientes, fazer vendas, pesquisas, etc.
🧩 Componentes de um Agente de Voz⌗
- LLM (modelo de linguagem) – o cérebro do agente (OpenAI, Anthropic, Google, etc.);
- System Prompt – define o papel, a personalidade e as regras do agente;
- Voice – escolha da voz (masculina/feminina, sotaque, idade);
- Tools (ferramentas) – funções que o agente pode executar, como acessar calendários, enviar e-mails, etc.
Exemplo: um agente de clínica odontológica pode verificar e criar eventos no Google Calendar, enviar confirmações, etc.
🔗 Integração com N8N⌗
O N8N é uma plataforma de automação visual (no-code). Com ela, o Vapi pode acionar fluxos de automação para:
- Criar agendamentos,
- Buscar informações de clientes,
- Enviar e-mails,
- Processar pagamentos,
- Gerar relatórios.
Essa união amplia as capacidades do agente, conectando-o a qualquer API ou serviço.
📞 Tipos de Voice Agents⌗
- Inbound – o cliente liga e o agente atende (suporte, agendamento, etc.);
- Outbound – o agente liga para o cliente (vendas, lembretes, campanhas);
- Web Widget – widget de voz em sites, iniciado pelo usuário.
⚙️ Criando um Agente no Vapi⌗
1. Estrutura do painel⌗
O dashboard mostra métricas (duração média, custos, número de chamadas). As duas seções principais são:
- Assistants: criação e gestão de agentes;
- Tools: criação de ferramentas usadas pelos agentes.
2. Criando o primeiro agente⌗
- Escolher o modelo (ex: GPT-4-mini-cluster);
- Configurar quem fala primeiro;
- Definir o System Prompt (identidade, propósito, tom de voz, fluxo de conversa, instruções de exceções);
- Adicionar arquivos (PDFs, FAQs, documentos de políticas) para servir como base de conhecimento;
- Ajustar tokens e temperatura (controle de custo e criatividade);
- Testar e iterar.
💡 A chave é testar, observar e refinar o prompt continuamente.
🧠 Exemplo Prático 1 – Suporte (empresa fictícia “Green Grass”)⌗
- Adicionou documento de políticas e FAQs ao agente;
- Testou chamadas simuladas;
- O agente respondeu perguntas sobre reembolsos, descontos e cartões-presente;
- O usuário refinou o prompt com base nas falhas de resposta.
🚗 Exemplo Prático 2 – Agendamento (“Hercules Detailing”)⌗
Criou um agente para uma empresa de estética automotiva:
- Ferramentas: verificar disponibilidade e criar eventos no Google Calendar;
- Configurou timezone e conexão com Google;
- Criou o System Prompt detalhando como e quando usar cada ferramenta;
- Testou reservas reais (o agente agendou corretamente e enviou e-mail de confirmação).
📊 Automação de Relatórios de Chamadas (via N8N)⌗
Após cada ligação, o Vapi envia:
- Resumo da chamada;
- Dados estruturados (e-mail, tipo de serviço, data/hora); para um webhook do N8N.
O N8N, então:
- Registra o log em uma planilha do Google Sheets;
- Envia um e-mail automático com o resumo da chamada.
📞 Conectando a um Número de Telefone⌗
O Vapi oferece até 10 números gratuitos para testes. É possível:
- Atribuir um agente a um número (para chamadas inbound);
- Criar números de saída (outbound);
- Importar números existentes do Twilio.
💰 Custos⌗
.ap73 - Agentes de VOZ - VAPI
1