Documentação do workflow n8n **mw13** — pipeline de resumo de…
INEMA
falta um modulo de pegar os conteudos de video e fazer a transcricao no inicio
Wikipédia e ferramentas de busca) e nós de formatação, o fluxo não apenas resume o conteúdo, mas também oferece contexto adicional e insights acionáveis.
Recursos
- Modelo JSON (não incluído no texto original, mas sugerido como parte do fluxo).
IA: Resumo de episódio de podcast e enriquecimento com Wikipédia
Visão Geral
Gatilho Manual e Configuração de Entrada:
- Ao clicar em "Executar Fluxo de Trabalho": Um gatilho manual inicia o fluxo de trabalho.
- Transcrição do Episódio do Podcast: Um nó de código simula ou fornece a transcrição bruta de um episódio de podcast. (Em um fluxo real, você provavelmente obteria a transcrição de uma fonte externa.)
Carregamento e Pré-processamento de Dados:
- Entrada do Fluxo para Documento JSON: Este nó converte a transcrição (texto não estruturado) em um documento JSON estruturado, facilitando o processamento pelos nós seguintes.
- Divisor Recursivo de Texto por Caracteres: Após a conversão para JSON, este nó divide o texto em blocos gerenciáveis. Isso evita que chamadas ao modelo de linguagem ultrapassem os limites de tokens e permite o processamento detalhado de textos longos.
Resumo e Extração:
- Resumir Transcrição: Um nó de encadeamento de resumo é usado para condensar a transcrição em um resumo mais curto e compreensível. O foco está nas principais ideias ou destaques do episódio.
- Extrair Tópicos e Perguntas: Outro nó de modelo de linguagem extrai os tópicos e perguntas principais a partir do resumo. Essas informações podem ser usadas para guiar pesquisas ou discussões adicionais. O nó é configurado para gerar uma lista de perguntas e tópicos relevantes.
Enriquecimento de Dados e Pesquisa:
- Pesquisar e Explicar Tópicos: Este nó de agente utiliza cada tópico (gerado na etapa anterior) e faz pesquisas (por exemplo, via ferramenta da Wikipédia) para explicar os tópicos com mais profundidade.
- Analisador de Saída Estruturada: Este nó organiza as saídas brutas da extração de tópicos e pesquisa em um formato JSON estruturado, seguindo um esquema predefinido com campos como: pergunta, motivo, entre outros.
Formatação e Entrega:
- Formatar Texto dos Tópicos e Título: Um nó de código formata os tópicos e perguntas em uma estrutura apropriada, incluindo formatação HTML. Isso torna o resumo visualmente mais atraente para os usuários finais.
- Enviar Resumo: Por fim, um nó do Gmail envia o resumo por e-mail. O e-mail inclui o resumo do episódio, os tópicos discutidos e perguntas para reflexão.
Gestão de Memória e Contexto:
- Memória de Janela Deslizante: Ao longo do fluxo, nós de memória ajudam a manter o contexto e armazenar histórico de conversas ou resultados intermediários. Isso garante que o modelo de linguagem tenha acesso ao contexto necessário para processar informações e gerar respostas adequadas.
Resumo do Fluxo
Disparo e Conversão da Entrada: O fluxo começa com um gatilho manual. A transcrição bruta do podcast é convertida em JSON estruturado e dividida em pequenos blocos.
Resumo e Extração de Tópicos: A transcrição é resumida, e tópicos e perguntas principais são extraídos usando um modelo de linguagem. Esse processo é enriquecido com contexto adicional por meio de ferramentas de pesquisa como a Wikipédia.
Enriquecimento e Estruturação da Saída: Os tópicos extraídos são aprofundados com pesquisas. A saída final é organizada com base em um esquema JSON consistente.
Formatação e Envio do Resumo: A saída estruturada é formatada em HTML e enviada por e-mail, entregando um resumo completo do conteúdo do episódio ao usuário.
Pontos-Chave
Design Modular: O fluxo de trabalho é altamente modular. Cada etapa (transcrição, resumo, extração, enriquecimento, formatação e entrega) é tratada por nós separados, o que facilita atualizações e manutenções.
Memória Contextual: Nós de memória mantêm o contexto durante o fluxo, essencial ao lidar com transcrições longas e processamento em várias etapas.
Saída Estruturada: O uso de um analisador de saída estruturada garante que os dados finais estejam organizados conforme um esquema definido, o que facilita integrações com outros sistemas (como Google Sheets).
Pesquisa e Formatação Automatizadas: Ao integrar ferramentas de pesquisa (como
mw13
mw13 - Resumo de episódio de podcast e enriquecimento com Wikipédia
1