Compilação de recursos sobre Claude Code Skills 2.0 e construção de…
INEMA
Esse arquivo youtube_scraper_skill_pt.md é um guia técnico completo para criar um sistema que coleta dados do YouTube automaticamente (um YouTube Scraper Pipeline). Ele explica passo a passo como construir um pipeline para extrair informações de vídeos de um canal.
Aqui está o que ele contém, resumido:
📄 Conteúdo do arquivo⌗
1️⃣ Visão geral do pipeline⌗
Explica a arquitetura do sistema que coleta dados do YouTube.
Etapas principais:
- Buscar todos os vídeos de um canal
- Baixar as transcrições dos vídeos
- Dividir o texto em partes para busca e IA
- Coletar comentários dos vídeos
Ferramentas usadas:
- YouTube Data API
- yt-dlp
- Node.js
- FFmpeg
2️⃣ Como pegar todos os vídeos de um canal⌗
Mostra como:
- descobrir o ID do canal
- transformar em playlist de uploads
- paginar os resultados da API
Exemplo de API usada:
youtube/v3/playlistItems
Também mostra como coletar:
- título
- descrição
- thumbnail
- data de publicação
- duração
- tags
- estatísticas (views, likes, comentários)
3️⃣ Como baixar a transcrição do vídeo⌗
Usa a ferramenta:
yt-dlp
Comando exemplo:
yt-dlp --write-auto-subs --sub-lang en --skip-download
Isso baixa:
data/vtt/videoID.en.vtt
Que é o arquivo de legenda.
4️⃣ Como transformar a legenda em texto estruturado⌗
O guia inclui um parser em JavaScript que:
- lê o arquivo
.vtt - extrai timestamps
- remove duplicações
- cria uma lista de segmentos
Exemplo de saída:
[
{ start: 0.0, end: 3.5, text: "Hello and welcome" }
]
Também gera:
fullText
com todo o texto do vídeo.
5️⃣ Como dividir o texto para IA (embeddings / RAG)⌗
Ele cria chunks de 500 palavras com sobreposição.
Isso é ideal para:
- vector database
- RAG
- busca semântica
- chat com vídeos
Cada chunk contém:
- texto
- tempo inicial
- tempo final
- link para o vídeo
- link com timestamp
Exemplo:
https://youtube.com/watch?v=VIDEO&t=120s
6️⃣ Como baixar comentários⌗
Usa a API:
youtube/v3/commentThreads
Extrai:
- autor
- texto
- likes
- data
- id do comentário
Também explica como lidar com:
comentários desativados (erro 403)
7️⃣ Analytics do YouTube (opcional)⌗
Se usar OAuth, pode coletar:
- watch time
- duração média
- CTR
- impressões
- inscritos ganhos
- fontes de tráfego
8️⃣ Estrutura de banco de dados recomendada⌗
Inclui tabelas sugeridas para:
Videos⌗
video_id
title
description
transcript
tags
stats
Comentários⌗
comment_id
video_id
author
text
likes
Analytics⌗
views
watch_time
ctr
impressions
9️⃣ Limites da API do YouTube⌗
Mostra o consumo da API:
| Operação | Custo |
|---|---|
| playlistItems | 1 |
| videos | 1 |
| commentThreads | 1 |
Limite diário:
10.000 unidades
🔟 Boas práticas do pipeline⌗
Inclui recomendações como:
- scraping incremental
- evitar downloads duplicados
- tratar vídeos sem legenda
- usar batch
- usar timestamps em UTC
🧠 O que esse sistema permite fazer⌗
Com isso você pode construir:
- IA que conversa com vídeos do YouTube
- buscador de conteúdo de canal
- gerador de artigos a partir de vídeos
- RAG com vídeos
- análise de comentários
- dataset de conteúdo
✅ Em resumo:
Esse arquivo é um manual para criar um sistema profissional de coleta de dados do YouTube para IA, analytics ou automação.
j144) 🦸♂️ Claude Code é IMPARÁVEL (Skills 2.0)
Claude Code acabou de se tornar IMPARÁVEL (Skills 2.0)⌗
🧱 Visão geral A Anthropic acabou de lançar o Claude Skills 2.0 e é realmente impressionante o quão poderoso isso é para automatizar fluxos de trabalho do seu negócio.
A maioria das pessoas ainda está apenas arranhando a superfície, usando prompts básicos no Claude.
Neste vídeo eu mostro exatamente como criar 5 habilidades práticas que vão economizar horas do seu tempo:
🎨 Gerador de infográficos usando a API do Krea no estilo exato da sua marca
📊 Skill de otimização de SEO que reescreve artigos para melhorar o ranking no Google
🧲 Conversor de YouTube para lead magnet, que cria páginas no Notion automaticamente
✅ Sistema de testes que diz se suas skills estão realmente funcionando
🔄 Skills portáteis que funcionam em todo o ecossistema do Claude
💻 Software principal⌗
🎙️ Transcrição de voz com agentes (Agentic Voice Transcription) glaido.com ↗
🚀 AntiGravity antigravity.google ↗
☁️ NotebookLM notebooklm.com ↗
📁 GitHub github.com ↗
🌲 Pinecone pinecone.io ↗
📚 Recursos⌗
🦄 Skill de scraper para YouTube
-
Skills 2.0 Claude - 5 Skils by Jack
1