Documentação do workflow n8n **mw13** — pipeline de resumo de…

INEMA

falta um modulo de pegar os conteudos de video e fazer a transcricao no inicio

Wikipédia e ferramentas de busca) e nós de formatação, o fluxo não apenas resume o conteúdo, mas também oferece contexto adicional e insights acionáveis.

Recursos

Modelo JSON (não incluído no texto original, mas sugerido como parte do fluxo).

IA: Resumo de episódio de podcast e enriquecimento com Wikipédia

Visão Geral

Gatilho Manual e Configuração de Entrada:

Ao clicar em "Executar Fluxo de Trabalho": Um gatilho manual inicia o fluxo de trabalho.
Transcrição do Episódio do Podcast: Um nó de código simula ou fornece a transcrição bruta de um episódio de podcast. (Em um fluxo real, você provavelmente obteria a transcrição de uma fonte externa.)

Carregamento e Pré-processamento de Dados:

Entrada do Fluxo para Documento JSON: Este nó converte a transcrição (texto não estruturado) em um documento JSON estruturado, facilitando o processamento pelos nós seguintes.
Divisor Recursivo de Texto por Caracteres: Após a conversão para JSON, este nó divide o texto em blocos gerenciáveis. Isso evita que chamadas ao modelo de linguagem ultrapassem os limites de tokens e permite o processamento detalhado de textos longos.

Resumo e Extração:

Resumir Transcrição: Um nó de encadeamento de resumo é usado para condensar a transcrição em um resumo mais curto e compreensível. O foco está nas principais ideias ou destaques do episódio.
Extrair Tópicos e Perguntas: Outro nó de modelo de linguagem extrai os tópicos e perguntas principais a partir do resumo. Essas informações podem ser usadas para guiar pesquisas ou discussões adicionais. O nó é configurado para gerar uma lista de perguntas e tópicos relevantes.

Enriquecimento de Dados e Pesquisa:

Pesquisar e Explicar Tópicos: Este nó de agente utiliza cada tópico (gerado na etapa anterior) e faz pesquisas (por exemplo, via ferramenta da Wikipédia) para explicar os tópicos com mais profundidade.
Analisador de Saída Estruturada: Este nó organiza as saídas brutas da extração de tópicos e pesquisa em um formato JSON estruturado, seguindo um esquema predefinido com campos como: pergunta, motivo, entre outros.

Formatação e Entrega:

Formatar Texto dos Tópicos e Título: Um nó de código formata os tópicos e perguntas em uma estrutura apropriada, incluindo formatação HTML. Isso torna o resumo visualmente mais atraente para os usuários finais.
Enviar Resumo: Por fim, um nó do Gmail envia o resumo por e-mail. O e-mail inclui o resumo do episódio, os tópicos discutidos e perguntas para reflexão.

Gestão de Memória e Contexto:

Memória de Janela Deslizante: Ao longo do fluxo, nós de memória ajudam a manter o contexto e armazenar histórico de conversas ou resultados intermediários. Isso garante que o modelo de linguagem tenha acesso ao contexto necessário para processar informações e gerar respostas adequadas.

Resumo do Fluxo

Disparo e Conversão da Entrada: O fluxo começa com um gatilho manual. A transcrição bruta do podcast é convertida em JSON estruturado e dividida em pequenos blocos.

Resumo e Extração de Tópicos: A transcrição é resumida, e tópicos e perguntas principais são extraídos usando um modelo de linguagem. Esse processo é enriquecido com contexto adicional por meio de ferramentas de pesquisa como a Wikipédia.

Enriquecimento e Estruturação da Saída: Os tópicos extraídos são aprofundados com pesquisas. A saída final é organizada com base em um esquema JSON consistente.

Formatação e Envio do Resumo: A saída estruturada é formatada em HTML e enviada por e-mail, entregando um resumo completo do conteúdo do episódio ao usuário.

Pontos-Chave

Design Modular: O fluxo de trabalho é altamente modular. Cada etapa (transcrição, resumo, extração, enriquecimento, formatação e entrega) é tratada por nós separados, o que facilita atualizações e manutenções.

Memória Contextual: Nós de memória mantêm o contexto durante o fluxo, essencial ao lidar com transcrições longas e processamento em várias etapas.

Saída Estruturada: O uso de um analisador de saída estruturada garante que os dados finais estejam organizados conforme um esquema definido, o que facilita integrações com outros sistemas (como Google Sheets).

Pesquisa e Formatação Automatizadas: Ao integrar ferramentas de pesquisa (como

mw13

mw13 - Resumo de episódio de podcast e enriquecimento com Wikipédia