Tutorial completo para montar o "Ultimate Media Agent" no n8n —…
INEMA
dublado
Aqui estão os hacks mais úteis para otimizar e deixar o “Ultimate Media Agent” no n8n mais rápido, barato e seguro.
1. Reduzir custos de tokens⌗
- No agente principal, mantenha descrições curtas e genéricas das ferramentas.
- Coloque instruções detalhadas somente nos subagentes.
- Use GPT-5 Mini no agente principal e reserve modelos mais caros só quando necessário (ex.: geração de imagens/vídeos de alta qualidade).
2. Pré-aprovação de mídia⌗
- Gere 3 previews baratas (1024x1024), aprove uma, e só então renderize a versão final 2048.
- No vídeo, teste com 6 a 8 segundos para validar estilo antes de gerar a versão longa.
3. Memória enxuta⌗
- Limite a janela de contexto do agente principal para evitar carregar histórico irrelevante.
- Para estado e histórico longo, salve dados no Google Drive ou Sheets, e puxe só quando necessário.
4. Resiliência a falhas⌗
- Ative “Continue on Fail” nos nós críticos para manter logs mesmo com erro.
- Tenha sempre um ramo de erro que registra no Sheets e notifica no Telegram.
- No upload/postagem, verifique se o arquivo já é público antes de tentar postar.
5. Trânsito de binários⌗
- Não envie binários entre fluxos no n8n quando não precisar — passe apenas IDs ou URLs.
- Manipule o binário dentro do subworkflow que vai usá-lo.
6. Acesso e segurança⌗
- Guarde todas as chaves nas credenciais do n8n, nunca em texto plano.
- No Google API, dê escopos mínimos necessários para cada fluxo.
- Antes de abrir um arquivo para “anyone with link”, verifique se não contém dados sensíveis.
7. Controle de qualidade⌗
- Padronize nomes de arquivos (ex.:
data_tarefa_tipo.ext) para facilitar busca e automações. - Use o Think Tool antes de perguntar follow-ups, evitando interações redundantes.
8. Modularidade⌗
- Mantenha cada ação (criar imagem, postar, criar doc) como subworkflow independente.
- Isso facilita trocar APIs (ex.: mudar de FAL.ai para outra de vídeo) sem mexer no fluxo principal.
9. Observabilidade⌗
- No log do Sheets, inclua:
timestamp,input,output,ações executadas,tokens usados,modelo. - Use este log para identificar quais ferramentas estão mais caras ou lentas.
10. Postagens seguras⌗
- Configure checagem automática de permissão antes de postar nas redes.
- Para redes sociais, use templates de legenda no subworkflow, assim mantém consistência no tom.
ilha de log para ver sequência de ferramentas e inputs; identifique gargalos. 8) Portabilidade: cada ferramenta é um subworkflow simples; trocar a API (ex.: vídeo) vira só trocar um nó. 9) Segurança: guarde chaves nas credenciais do n8n; nunca em plain text; restrinja escopos do Google.
- Erros comuns e correções
1) Post falha por permissão: torne o arquivo público antes de chamar Blotato. 2) Subworkflow não responde no Telegram: verifique se está recebendo chat_id e se o gatilho é “When executed by another workflow”. 3) Vídeo não conclui: ajuste polling e timeouts no FAL; confirme se a URL da imagem é acessível. 4) Edits não aplicam: confira picture_id do Drive e se o download binário está correto. 5) Agente pergunta demais: adicione Think Tool antes de follow‑ups e enriqueça notas operacionais. 6) Planilha de log vazia: confirme range/sheet certo e mapeamento de campos no Append.
- Comandos de exemplo para usar no Telegram
1) Renomear e organizar – “Nomeie a imagem como speaker e coloque em media” 2) Editar imagem – “Edite a imagem speaker: estilo estúdio, vibrante, energético, com sensação de música” 3) Converter imagem em vídeo – “Use a imagem speaker (preview 1) e crie um vídeo VFX com luzes no ritmo e música” 4) Criar vídeo do zero – “Crie vídeo vertical 9:16 com o tema ‘transições de luz ao som de synthwave’, título Neon Pulse” 5) Pesquisa social e doc – “Ache 2 vídeos de alta performance sobre NAND em TikTok, Instagram e YouTube e compile num Google Doc” 6) Postagem – “Poste o vídeo JBL VFX no TikTok com a legenda ‘music to my ears’” 7) Enviar por e‑mail – “Envie o vídeo JBL VFX para Dexter Morgan com o assunto ‘Draft do anúncio’”
Quer que eu gere um checklist de implementação em JSON (campos e valores) para você colar dentro dos nodes do n8n e acelerar o setup?
L.ai V3 Fast (imagem→vídeo). 3. Polling, download, envio ao Telegram e salvamento no Drive.
Prompt do subagente criativo (resumo) – Overview: você é um agente criativo especialista em prompts de imagem/vídeo. – Regras: prompts de imagem detalhados e estilizados; prompts de vídeo concisos, enérgicos, um único take sem cortes; descreva sons/diálogos quando houver. – Ação: sempre use as ferramentas para produzir entregáveis.
- Agente de redes sociais (pesquisa) com Apify
1) Três HTTP Request nodes (ou Apify nodes) para atores de YouTube, TikTok e Instagram. 2) Parâmetros essenciais: search_term e limit. 3) Saída normalizada: plataforma, título, creator, url, métricas (views/likes), caption se houver. 4) Esse subagente apenas pesquisa; o agente principal depois pode mandar jogar os resultados no create_doc_tool.
Exemplo de comando do usuário: “Ache 2 vídeos de alta performance sobre NAND em TikTok, Instagram e YouTube” → subagente retorna 2 por plataforma.
-
Ferramenta de criação de documento (workflow 8) Entradas: doc_title, doc_content. Passos:
-
Criar doc no Google Docs, obter document_id.
-
Atualizar o conteúdo do doc.
-
Salvar na pasta media analysis.
-
Retornar link clicável.
-
Agente de postagem (workflows 5–7) com Blotato Entradas comuns: file_id (vídeo/imagem no Drive), text (legenda). Passos:
-
Garantir que o arquivo do Drive esteja público (qualquer pessoa com o link → viewer).
-
Upload para Blotato.
-
Postar na plataforma selecionada (X, TikTok, Instagram).
-
Retornar submission_id e status.
-
Agente Google Drive (operações úteis) Ferramentas típicas:
-
change_name: renomear um arquivo pelo file_id.
-
search_media: buscar por nome/termo na pasta media.
-
share_file_public: alterar permissão para “anyone with the link”.
-
get_file_url: obter URL público para postar/gerar vídeo.
-
list_docs_em media analysis.
-
Registro e observabilidade
1) Ative return intermediate steps no agente principal. 2) Após cada execução, no ramo success e no ramo error: – Mapeie timestamp, workflow, input (message.text), output (mensagem final), actions (o array de ferramentas e parâmetros), model, prompt_tokens, completion_tokens, total_tokens, status (ok/erro). 3) Use Google Sheets: Append para a planilha de log. 4) Opcional: crie alertas no Telegram quando status = erro.
- Fluxo de teste sugerido
1) Envie uma foto no Telegram. 2) Agente pergunta nome; responda “speaker”. 3) Peça “edite essa imagem: estúdio vibrante, energético, destacando sensação de ouvir música”. 4) O agente criativo retorna 3 proofs 1024. Aprove uma: “use a número 1 e gere final 2048”. 5) Peça “transforme a nº 1 em vídeo VFX com música e luzes sincronizadas, tipo anúncio JBL”. 6) Envie: “mandar para Dexter Morgan por e‑mail”. O agente: – Busca contato no contacts_agent – Torna o arquivo público – Envia o e‑mail com link 7) Peça: “postar o vídeo no TikTok com a legenda ‘music to my ears’”.
- Custos e limites (resumo prático)
1) LLM principal: GPT‑5 Mini barato em input, moderado em output; use prompts curtos no agente principal e deixe detalhes nos subagentes. 2) Imagem: custo por imagem cresce de 1 a \~17 centavos conforme qualidade; proofs em 1024 saem mais baratas. 3) Vídeo V3 Fast: cobrado por segundo; áudio ligado custa mais; use 6–8s para testes. 4) Assinaturas: Blotato (postagem), Apify (scrapers). Use cupons quando houver. 5) Web: Perplexity/Tavily baratos para consultas leves.
- Boas práticas e hacks
1) Economia de tokens: descrições curtas no agente principal; instruções detalhadas nos subagentes. 2) Robustez: mantenha “Continue on Fail” e ramo de erro para sempre registrar falhas. 3) Memória curta: limite a janela de contexto do agente principal e salve estado no Drive/Sheets. 4) Consistência visual: gere 3 proofs baratas, aprove uma e só então renderize final. 5) Permissões: antes de postar/enviar, garanta share_file_public. 6) Binários entre fluxos: passe apenas IDs/URLs nos agentes; manipule binário no subworkflow. 7) Debug: use a plan
FA
Passo a passo para montar o “Ultimate Media Agent” no n8n
- Pré‑requisitos e chaves
1) Crie as contas/keys: OpenAI ou OpenRouter (modelos GPT‑5 Mini e GPT‑4.1 se quiser), FAL.ai (para vídeo V3 Fast), Apify (scrapers), Blotato (postagem em redes), Perplexity e/ou Tavily (web), OpenWeatherMap (opcional), Google Cloud (OAuth para Drive, Docs e Sheets), Telegram BotFather (token do bot). 2) No n8n, cadastre todas as credenciais: HTTP genéricas (Apify, Perplexity, Tavily, FAL), Google Drive/Docs/Sheets OAuth2, Telegram, Blotato. 3) No Google Drive, crie as pastas exatas: media e media analysis. 4) No Google Sheets, crie uma planilha para logs com colunas: timestamp, workflow, input, output, actions, model, prompt_tokens, completion_tokens, total_tokens, status.
-
Estrutura geral de fluxos (serão 9 workflows) A. 4 workflows criativos
-
create_image
- edit_image
- image_to_video
- create_video B. 3 workflows de postagem
- post_to_x
- post_to_tiktok
- post_to_instagram C. 1 workflow de documentos
- create_doc D. 1 workflow principal (orquestrador)
-
ultimate_media_agent
-
Entradas do usuário via Telegram (workflow principal)
1) Adicione Telegram Trigger. 2) Desvie para dois caminhos: a) Se veio foto: baixe o binário, envie ao Google Drive na pasta media; pergunte no próprio Telegram “Como quer nomear o arquivo?”; salve o nome. b) Se veio texto: encaminhe diretamente ao Agente de IA. 3) Normalize a entrada: use Set node para garantir uma variável única message.text, válida tanto para foto quanto texto. 4) Guarde o chat_id como variável (usará ao responder do subfluxo).
- Agente principal (AI Agent) no workflow 9
1) Modelo: GPT‑5 Mini (via OpenRouter). Ative fallback para GPT‑5 Mini via OpenAI (ou mude para Anthropic/Google). 2) Ative Return intermediate steps. 3) Em “On Error”, habilite continuar e crie dois ramos: success e error. 4) System prompt enxuto e objetivo: – Você é um gerente-orquestrador. Recebe um pedido e apenas chama a ferramenta certa. Não escreva e‑mails nem resumos por conta própria. Sempre responda algo ao usuário. – Notas operacionais:
- Se o usuário enviar foto, pergunte nome e renomeie no Drive.
- Para e‑mail/compartilhamento, busque contato primeiro.
- Imagens e vídeos estão no Drive/pasta media; use o agente Drive.
- Use Think Tool antes de perguntar follow‑ups.
- Para postar, torne o arquivo público no Drive.
- Para vídeos, não pergunte duração (V3 Fast \~8s).
-
Sempre retorne mensagem final ao usuário. 5) Defina ferramentas do agente principal apontando para subagentes/sub‑workflows: google_drive_agent, email_agent, calendar_agent, contacts_agent, social_media_agent, creative_agent, posting_agent, web_agent, create_doc_tool, think_tool. Descrições breves aqui; detalhes ficam nos subagentes para economizar tokens.
-
Subagente criativo e 4 ferramentas (workflows 1–4) Gatilho de cada subworkflow: When executed by another workflow.
A. create_image Entradas: image_name, image_prompt, chat_id. Passos:
- Chamada à API de imagem (ex.: OpenAI Images) com image_prompt.
- Baixe URL como binário.
- Envie o arquivo ao Telegram usando chat_id.
- Salve no Drive/pasta media com image_name.
B. edit_image Entradas: image_name, image_request, chat_id, picture_id (ID do arquivo no Drive). Passos:
- Baixe a imagem original do Drive via picture_id.
- Chame a API de edição com a imagem original + image_request.
- Retorne previews (ex.: 1024×1024) ao Telegram.
- Salve no Drive como proofs; após confirmação, gere final 2048.
C. create_video Entradas: video_prompt, chat_id, video_title, aspect_ratio. Passos:
- Chame FAL.ai V3 Fast (texto→vídeo, áudio on se quiser).
- Faça polling até concluir.
- Baixe e salve no Drive/pasta media; envie ao Telegram.
D. image_to_video Entradas: file_id (imagem no Drive), video_prompt, chat_id, original_image_name. Passos:
- Compartilhe a imagem no Drive para obter URL público, baixe/obtenha URL.
- Chame
Resumo :
Apresenta o “Ultimate Media Agent” no n8n, um sistema de agentes de IA integrados que combina funções de assistente pessoal com ferramentas criativas e de automação, tudo disponibilizado gratuitamente. Ele pode gerenciar e-mails, Google Drive, calendário, contatos, criar e editar imagens, transformar imagens em vídeos, criar vídeos do zero, publicar em redes sociais (TikTok, Instagram, X), pesquisar conteúdos em plataformas, compilar resultados em Google Docs e registrar todas as ações, inclusive erros, com detalhes de entrada, saída e uso de tokens.
Principais pontos:
- Interação via Telegram, onde o usuário envia imagens, vídeos ou textos e solicita ações.
- Agente principal delega tarefas a subagentes especializados (criativo, redes sociais, postagem, docs, web, etc.).
- Uso de modelos GPT-5 Mini (via OpenRouter e OpenAI) e integrações como FAL AI (vídeo), Apify (scrapers), Blotato (postagem em redes), Perplexity e Tavily (pesquisa).
- Subagentes possuem ferramentas específicas como criar imagem, editar imagem, imagem para vídeo, criar vídeo, postar em plataformas e criar documentos.
- Fluxos simples trocam variáveis entre si para executar tarefas e enviar resultados para o Google Drive e Telegram.
- Pesquisa de vídeos de alta performance em múltiplas redes e compilação em Google Docs.
- Sistema de registro em Google Sheets para monitorar entradas, saídas, tokens e ações.
- Configuração exige download de 9 workflows, ajustes de pastas no Google Drive, conexão de ferramentas e APIs, e integração com planilhas de log.
- Custos incluem uso de modelos GPT, geração de imagens/vídeos, e assinaturas opcionais de Blotato e Apify.
Construir o Exército Definitivo de Agentes de Mídia no n8n
Apresento o Agente de Mídia com IA definitivo, que combina recursos poderosos de assistente pessoal com ferramentas criativas avançadas — e estou oferecendo tudo gratuitamente.
Esse agente pode gerenciar e-mails, calendários, contatos e Google Drive, além de criar e editar imagens, produzir e editar vídeos, transformar imagens em vídeos, publicar conteúdo em várias redes sociais, fazer raspagem de plataformas sociais para pesquisas e compilar resultados no Google Docs. Ele ainda conta com capacidade completa de pesquisa na web.
Um dos seus melhores recursos é o registro completo de atividades, permitindo ver cada ação executada, seja bem-sucedida ou não, junto com todos os detalhes de entrada, saída e uso de tokens. Fique até o final do vídeo, onde compartilharei todos os recursos, modelos e fluxos de trabalho necessários para você configurar tudo sozinho.
Planilha no Google Docs com detalhamento de custos e instruções de configuração
Modelo de planilha no Google Sheets
ap55 - Exército Definitivo de Agentes de Mídia
1