Tutorial completo para montar o "Ultimate Media Agent" no n8n

INEMA

dublado

youtube.com/watch ↗

Aqui estão os hacks mais úteis para otimizar e deixar o “Ultimate Media Agent” no n8n mais rápido, barato e seguro.

1. Reduzir custos de tokens⌗

No agente principal, mantenha descrições curtas e genéricas das ferramentas.
Coloque instruções detalhadas somente nos subagentes.
Use GPT-5 Mini no agente principal e reserve modelos mais caros só quando necessário (ex.: geração de imagens/vídeos de alta qualidade).

2. Pré-aprovação de mídia⌗

Gere 3 previews baratas (1024x1024), aprove uma, e só então renderize a versão final 2048.
No vídeo, teste com 6 a 8 segundos para validar estilo antes de gerar a versão longa.

3. Memória enxuta⌗

Limite a janela de contexto do agente principal para evitar carregar histórico irrelevante.
Para estado e histórico longo, salve dados no Google Drive ou Sheets, e puxe só quando necessário.

4. Resiliência a falhas⌗

Ative “Continue on Fail” nos nós críticos para manter logs mesmo com erro.
Tenha sempre um ramo de erro que registra no Sheets e notifica no Telegram.
No upload/postagem, verifique se o arquivo já é público antes de tentar postar.

5. Trânsito de binários⌗

Não envie binários entre fluxos no n8n quando não precisar — passe apenas IDs ou URLs.
Manipule o binário dentro do subworkflow que vai usá-lo.

6. Acesso e segurança⌗

Guarde todas as chaves nas credenciais do n8n, nunca em texto plano.
No Google API, dê escopos mínimos necessários para cada fluxo.
Antes de abrir um arquivo para “anyone with link”, verifique se não contém dados sensíveis.

7. Controle de qualidade⌗

Padronize nomes de arquivos (ex.: data_tarefa_tipo.ext) para facilitar busca e automações.
Use o Think Tool antes de perguntar follow-ups, evitando interações redundantes.

8. Modularidade⌗

Mantenha cada ação (criar imagem, postar, criar doc) como subworkflow independente.
Isso facilita trocar APIs (ex.: mudar de FAL.ai para outra de vídeo) sem mexer no fluxo principal.

9. Observabilidade⌗

No log do Sheets, inclua: timestamp, input, output, ações executadas, tokens usados, modelo.
Use este log para identificar quais ferramentas estão mais caras ou lentas.

10. Postagens seguras⌗

Configure checagem automática de permissão antes de postar nas redes.
Para redes sociais, use templates de legenda no subworkflow, assim mantém consistência no tom.

ilha de log para ver sequência de ferramentas e inputs; identifique gargalos. 8) Portabilidade: cada ferramenta é um subworkflow simples; trocar a API (ex.: vídeo) vira só trocar um nó. 9) Segurança: guarde chaves nas credenciais do n8n; nunca em plain text; restrinja escopos do Google.

Erros comuns e correções

1) Post falha por permissão: torne o arquivo público antes de chamar Blotato. 2) Subworkflow não responde no Telegram: verifique se está recebendo chat_id e se o gatilho é “When executed by another workflow”. 3) Vídeo não conclui: ajuste polling e timeouts no FAL; confirme se a URL da imagem é acessível. 4) Edits não aplicam: confira picture_id do Drive e se o download binário está correto. 5) Agente pergunta demais: adicione Think Tool antes de follow‑ups e enriqueça notas operacionais. 6) Planilha de log vazia: confirme range/sheet certo e mapeamento de campos no Append.

Comandos de exemplo para usar no Telegram

1) Renomear e organizar – “Nomeie a imagem como speaker e coloque em media” 2) Editar imagem – “Edite a imagem speaker: estilo estúdio, vibrante, energético, com sensação de música” 3) Converter imagem em vídeo – “Use a imagem speaker (preview 1) e crie um vídeo VFX com luzes no ritmo e música” 4) Criar vídeo do zero – “Crie vídeo vertical 9:16 com o tema ‘transições de luz ao som de synthwave’, título Neon Pulse” 5) Pesquisa social e doc – “Ache 2 vídeos de alta performance sobre NAND em TikTok, Instagram e YouTube e compile num Google Doc” 6) Postagem – “Poste o vídeo JBL VFX no TikTok com a legenda ‘music to my ears’” 7) Enviar por e‑mail – “Envie o vídeo JBL VFX para Dexter Morgan com o assunto ‘Draft do anúncio’”

Quer que eu gere um checklist de implementação em JSON (campos e valores) para você colar dentro dos nodes do n8n e acelerar o setup?

L.ai V3 Fast (imagem→vídeo). 3. Polling, download, envio ao Telegram e salvamento no Drive.

Prompt do subagente criativo (resumo) – Overview: você é um agente criativo especialista em prompts de imagem/vídeo. – Regras: prompts de imagem detalhados e estilizados; prompts de vídeo concisos, enérgicos, um único take sem cortes; descreva sons/diálogos quando houver. – Ação: sempre use as ferramentas para produzir entregáveis.

Agente de redes sociais (pesquisa) com Apify

1) Três HTTP Request nodes (ou Apify nodes) para atores de YouTube, TikTok e Instagram. 2) Parâmetros essenciais: search_term e limit. 3) Saída normalizada: plataforma, título, creator, url, métricas (views/likes), caption se houver. 4) Esse subagente apenas pesquisa; o agente principal depois pode mandar jogar os resultados no create_doc_tool.

Exemplo de comando do usuário: “Ache 2 vídeos de alta performance sobre NAND em TikTok, Instagram e YouTube” → subagente retorna 2 por plataforma.

Ferramenta de criação de documento (workflow 8) Entradas: doc_title, doc_content. Passos:
Criar doc no Google Docs, obter document_id.
Atualizar o conteúdo do doc.
Salvar na pasta media analysis.
Retornar link clicável.
Agente de postagem (workflows 5–7) com Blotato Entradas comuns: file_id (vídeo/imagem no Drive), text (legenda). Passos:
Garantir que o arquivo do Drive esteja público (qualquer pessoa com o link → viewer).
Upload para Blotato.
Postar na plataforma selecionada (X, TikTok, Instagram).
Retornar submission_id e status.
Agente Google Drive (operações úteis) Ferramentas típicas:
change_name: renomear um arquivo pelo file_id.
search_media: buscar por nome/termo na pasta media.
share_file_public: alterar permissão para “anyone with the link”.
get_file_url: obter URL público para postar/gerar vídeo.
list_docs_em media analysis.
Registro e observabilidade

1) Ative return intermediate steps no agente principal. 2) Após cada execução, no ramo success e no ramo error: – Mapeie timestamp, workflow, input (message.text), output (mensagem final), actions (o array de ferramentas e parâmetros), model, prompt_tokens, completion_tokens, total_tokens, status (ok/erro). 3) Use Google Sheets: Append para a planilha de log. 4) Opcional: crie alertas no Telegram quando status = erro.

Fluxo de teste sugerido

1) Envie uma foto no Telegram. 2) Agente pergunta nome; responda “speaker”. 3) Peça “edite essa imagem: estúdio vibrante, energético, destacando sensação de ouvir música”. 4) O agente criativo retorna 3 proofs 1024. Aprove uma: “use a número 1 e gere final 2048”. 5) Peça “transforme a nº 1 em vídeo VFX com música e luzes sincronizadas, tipo anúncio JBL”. 6) Envie: “mandar para Dexter Morgan por e‑mail”. O agente: – Busca contato no contacts_agent – Torna o arquivo público – Envia o e‑mail com link 7) Peça: “postar o vídeo no TikTok com a legenda ‘music to my ears’”.

Custos e limites (resumo prático)

1) LLM principal: GPT‑5 Mini barato em input, moderado em output; use prompts curtos no agente principal e deixe detalhes nos subagentes. 2) Imagem: custo por imagem cresce de 1 a \~17 centavos conforme qualidade; proofs em 1024 saem mais baratas. 3) Vídeo V3 Fast: cobrado por segundo; áudio ligado custa mais; use 6–8s para testes. 4) Assinaturas: Blotato (postagem), Apify (scrapers). Use cupons quando houver. 5) Web: Perplexity/Tavily baratos para consultas leves.

Boas práticas e hacks

1) Economia de tokens: descrições curtas no agente principal; instruções detalhadas nos subagentes. 2) Robustez: mantenha “Continue on Fail” e ramo de erro para sempre registrar falhas. 3) Memória curta: limite a janela de contexto do agente principal e salve estado no Drive/Sheets. 4) Consistência visual: gere 3 proofs baratas, aprove uma e só então renderize final. 5) Permissões: antes de postar/enviar, garanta share_file_public. 6) Binários entre fluxos: passe apenas IDs/URLs nos agentes; manipule binário no subworkflow. 7) Debug: use a plan

Passo a passo para montar o “Ultimate Media Agent” no n8n

Pré‑requisitos e chaves

1) Crie as contas/keys: OpenAI ou OpenRouter (modelos GPT‑5 Mini e GPT‑4.1 se quiser), FAL.ai (para vídeo V3 Fast), Apify (scrapers), Blotato (postagem em redes), Perplexity e/ou Tavily (web), OpenWeatherMap (opcional), Google Cloud (OAuth para Drive, Docs e Sheets), Telegram BotFather (token do bot). 2) No n8n, cadastre todas as credenciais: HTTP genéricas (Apify, Perplexity, Tavily, FAL), Google Drive/Docs/Sheets OAuth2, Telegram, Blotato. 3) No Google Drive, crie as pastas exatas: media e media analysis. 4) No Google Sheets, crie uma planilha para logs com colunas: timestamp, workflow, input, output, actions, model, prompt_tokens, completion_tokens, total_tokens, status.

Estrutura geral de fluxos (serão 9 workflows) A. 4 workflows criativos
create_image
edit_image
image_to_video
create_video B. 3 workflows de postagem
post_to_x
post_to_tiktok
post_to_instagram C. 1 workflow de documentos
create_doc D. 1 workflow principal (orquestrador)
ultimate_media_agent
Entradas do usuário via Telegram (workflow principal)

1) Adicione Telegram Trigger. 2) Desvie para dois caminhos: a) Se veio foto: baixe o binário, envie ao Google Drive na pasta media; pergunte no próprio Telegram “Como quer nomear o arquivo?”; salve o nome. b) Se veio texto: encaminhe diretamente ao Agente de IA. 3) Normalize a entrada: use Set node para garantir uma variável única message.text, válida tanto para foto quanto texto. 4) Guarde o chat_id como variável (usará ao responder do subfluxo).

Agente principal (AI Agent) no workflow 9

1) Modelo: GPT‑5 Mini (via OpenRouter). Ative fallback para GPT‑5 Mini via OpenAI (ou mude para Anthropic/Google). 2) Ative Return intermediate steps. 3) Em “On Error”, habilite continuar e crie dois ramos: success e error. 4) System prompt enxuto e objetivo: – Você é um gerente-orquestrador. Recebe um pedido e apenas chama a ferramenta certa. Não escreva e‑mails nem resumos por conta própria. Sempre responda algo ao usuário. – Notas operacionais:

Se o usuário enviar foto, pergunte nome e renomeie no Drive.
Para e‑mail/compartilhamento, busque contato primeiro.
Imagens e vídeos estão no Drive/pasta media; use o agente Drive.
Use Think Tool antes de perguntar follow‑ups.
Para postar, torne o arquivo público no Drive.
Para vídeos, não pergunte duração (V3 Fast \~8s).
Sempre retorne mensagem final ao usuário. 5) Defina ferramentas do agente principal apontando para subagentes/sub‑workflows: google_drive_agent, email_agent, calendar_agent, contacts_agent, social_media_agent, creative_agent, posting_agent, web_agent, create_doc_tool, think_tool. Descrições breves aqui; detalhes ficam nos subagentes para economizar tokens.
Subagente criativo e 4 ferramentas (workflows 1–4) Gatilho de cada subworkflow: When executed by another workflow.

A. create_image Entradas: image_name, image_prompt, chat_id. Passos:

Chamada à API de imagem (ex.: OpenAI Images) com image_prompt.
Baixe URL como binário.
Envie o arquivo ao Telegram usando chat_id.
Salve no Drive/pasta media com image_name.

B. edit_image Entradas: image_name, image_request, chat_id, picture_id (ID do arquivo no Drive). Passos:

Baixe a imagem original do Drive via picture_id.
Chame a API de edição com a imagem original + image_request.
Retorne previews (ex.: 1024×1024) ao Telegram.
Salve no Drive como proofs; após confirmação, gere final 2048.

C. create_video Entradas: video_prompt, chat_id, video_title, aspect_ratio. Passos:

Chame FAL.ai V3 Fast (texto→vídeo, áudio on se quiser).
Faça polling até concluir.
Baixe e salve no Drive/pasta media; envie ao Telegram.

D. image_to_video Entradas: file_id (imagem no Drive), video_prompt, chat_id, original_image_name. Passos:

Compartilhe a imagem no Drive para obter URL público, baixe/obtenha URL.
Chame

Resumo :

Apresenta o “Ultimate Media Agent” no n8n, um sistema de agentes de IA integrados que combina funções de assistente pessoal com ferramentas criativas e de automação, tudo disponibilizado gratuitamente. Ele pode gerenciar e-mails, Google Drive, calendário, contatos, criar e editar imagens, transformar imagens em vídeos, criar vídeos do zero, publicar em redes sociais (TikTok, Instagram, X), pesquisar conteúdos em plataformas, compilar resultados em Google Docs e registrar todas as ações, inclusive erros, com detalhes de entrada, saída e uso de tokens.

Principais pontos:

Interação via Telegram, onde o usuário envia imagens, vídeos ou textos e solicita ações.
Agente principal delega tarefas a subagentes especializados (criativo, redes sociais, postagem, docs, web, etc.).
Uso de modelos GPT-5 Mini (via OpenRouter e OpenAI) e integrações como FAL AI (vídeo), Apify (scrapers), Blotato (postagem em redes), Perplexity e Tavily (pesquisa).
Subagentes possuem ferramentas específicas como criar imagem, editar imagem, imagem para vídeo, criar vídeo, postar em plataformas e criar documentos.
Fluxos simples trocam variáveis entre si para executar tarefas e enviar resultados para o Google Drive e Telegram.
Pesquisa de vídeos de alta performance em múltiplas redes e compilação em Google Docs.
Sistema de registro em Google Sheets para monitorar entradas, saídas, tokens e ações.
Configuração exige download de 9 workflows, ajustes de pastas no Google Drive, conexão de ferramentas e APIs, e integração com planilhas de log.
Custos incluem uso de modelos GPT, geração de imagens/vídeos, e assinaturas opcionais de Blotato e Apify.

Construir o Exército Definitivo de Agentes de Mídia no n8n

Apresento o Agente de Mídia com IA definitivo, que combina recursos poderosos de assistente pessoal com ferramentas criativas avançadas — e estou oferecendo tudo gratuitamente.

Esse agente pode gerenciar e-mails, calendários, contatos e Google Drive, além de criar e editar imagens, produzir e editar vídeos, transformar imagens em vídeos, publicar conteúdo em várias redes sociais, fazer raspagem de plataformas sociais para pesquisas e compilar resultados no Google Docs. Ele ainda conta com capacidade completa de pesquisa na web.

Um dos seus melhores recursos é o registro completo de atividades, permitindo ver cada ação executada, seja bem-sucedida ou não, junto com todos os detalhes de entrada, saída e uso de tokens. Fique até o final do vídeo, onde compartilharei todos os recursos, modelos e fluxos de trabalho necessários para você configurar tudo sozinho.

Planilha no Google Docs com detalhamento de custos e instruções de configuração

Modelo de planilha no Google Sheets

ap55 - Exército Definitivo de Agentes de Mídia

chatgpt.com ↗

Tutorial completo para montar o "Ultimate Media Agent" no n8n —…