Tutorial completo sobre como usar Claude Code + Firecrawl MCP Server…

INEMA

No final, o objetivo de tudo isso é transformar qualquer site da internet

🎯 Objetivo Técnico⌗

Converter sites em:

📄 Texto limpo (Markdown)
📊 Dados estruturados (CSV / JSON)
🗺 Estrutura completa do site (Map)
🖼 Screenshots
🎨 Informações de branding
🧠 Conteúdo pronto para alimentar LLMs

Ou seja: transformar páginas desorganizadas da web em dados organizados e prontos para uso inteligente.

🧠 Objetivo Estratégico⌗

Substituir isso:

Configurar APIs manualmente Criar automações complexas Lidar com múltiplos endpoints Construir scrapers do zero

Por isso:

Linguagem natural Claude decide as ferramentas Fluxo agentivo Execução automática

💼 Objetivo Prático (Aplicações Reais)⌗

Você pode usar isso para:

Criar bancos de dados a partir de sites
Gerar datasets para treinar modelos
Monitorar concorrentes
Extrair produtos para e-commerce
Coletar leads
Analisar branding
Construir RAG (Retrieval-Augmented Generation)
Criar ferramentas SaaS baseadas em dados públicos

🚀 Objetivo Maior⌗

Transformar a web inteira em:

🔹 Fonte estruturada de dados 🔹 Base para automação inteligente 🔹 Infraestrutura para negócios com IA

Em vez de ver sites como páginas estáticas, você passa a ver como:

APIs prontas esperando para serem usadas.

🧩 Resumo Final⌗

O objetivo não é só fazer scraping.

O objetivo é:

Criar um sistema onde você pede o resultado em linguagem natural E a IA descobre como chegar lá sozinha.

Isso é o verdadeiro ganho.

QUALIFICAR NICHO

Aqui estão os principais hacks estratégicos usados (e implícitos) no processo para extrair o máximo do Claude Code + Firecrawl:

🔥 1️⃣ Não diga qual ferramenta usar⌗

Hack: nunca diga “use scrape” ou “use map”.

Só diga o resultado final desejado.

Exemplo bom:

I want all job listings from this website as structured data in CSV format.

Deixe o Claude decidir:

Scrape → Map → Crawl → Extract Isso ativa o fluxo agentivo.

🔥 2️⃣ Use Plan Mode para tarefas grandes⌗

Para sites com paginação ou muitas URLs:

Create a plan before executing.

Isso faz o Claude:

Entender a estrutura
Perguntar o que extrair
Definir estratégia antes de gastar créditos

🔥 3️⃣ Limite o volume primeiro⌗

Antes de extrair 1.700 itens, diga:

Start with 50 results as a test.

Hack de economia:

Testa estrutura
Evita gastar créditos desnecessários
Ajusta campos antes de escalar

🔥 4️⃣ Sempre peça saída estruturada explícita⌗

Em vez de:

Get all jobs.

Use:

Return the results as structured data in CSV format with these fields: title, company, location, salary, description, apply_url.

Isso força Extract corretamente.

🔥 5️⃣ Use Map antes de Crawl (em sites grandes)⌗

Se for site com múltiplas páginas:

First map the website structure. Then extract the data from all relevant pages.

Hack: evita perder páginas paginadas.

🔥 6️⃣ Quando extract falhar⌗

Se vier vazio, diga:

The extract returned empty results. Try a more robust crawling strategy and then extract again.

Isso ativa autocorreção.

🔥 7️⃣ Peça resumo em vez de descrição completa⌗

Economiza tokens e créditos:

Return summary instead of full descriptions.

🔥 8️⃣ Combine tarefas em paralelo⌗

Abra dois agentes:

Um faz map
Outro faz branding

Hack de produtividade.

🔥 9️⃣ Peça sempre os links de origem⌗

Para rastreabilidade:

Include the source URL for each item.

🔥 🔟 Use o CLAUDE.md estrategicamente⌗

Inclua regras como:

Sempre preferir extract para dados estruturados
Sempre mapear antes de crawl em sites grandes
Sempre perguntar campos antes de executar

Isso transforma o projeto em sistema inteligente.

🚀 Hack avançado (nível profissional)⌗

Em vez de pedir scraping direto, use:

Analyze this website and propose the best extraction strategy before executing.

Isso faz o Claude pensar antes de agir.

🎯 Hack mental mais importante⌗

Não pense:

“Qual endpoint usar?”

Pense:

“Qual resultado eu quero?”

Deixe o MCP decidir o resto.

Principais prompts usados ao longo do processo, organizados por etapa:

🔹 1️⃣ Conectar ao MCP do Firecrawl⌗

Hey Claude, I want to connect to Firecrawl's MCP server. You can do that using this command. But I’m not going to give you my API key here — I’ll put it in a .env file. So please create that file for me, then initialize and connect to Firecrawl’s MCP server.

🔹 2️⃣ Testar se está funcionando⌗

Scrape this website and return the content in markdown.

(Usado apenas para validar que o MCP está ativo.)

🔹 3️⃣ Criar Cheat Sheet do Firecrawl⌗

Create a Firecrawl cheat sheet as a markdown file in this project that you can reference. It should explain the different tools and when to use each one.

🔹 4️⃣ Criar o CLAUDE.md (sistema do projeto)⌗

```Help me set up a CLAUDE.md file for this project. This project is specifically for scraping data, extracting it, getting screenshots, crawling websites, and mapping sites.

You have access to the Firecrawl MCP server and the firecrawl-cheatsheet.md which explains how the MCP server works and when to use each tool.```

🔹 5️⃣ Caso prático – Extrair 1.700 vagas⌗

```I found this website and I have about 1,700 job opportunities I want to look at. I need help using the Firecrawl MCP server to get all of them listed out.

I want these as structured data so I can put them into a Google Sheet.```

Depois ele responde perguntas como:

How many listings?
What data fields?
Full descriptions or summaries?

🔹 6️⃣ Screenshot + Branding⌗

Please grab screenshots of this page and help me understand the branding.

🔹 7️⃣ Mapear um site completo⌗

Go ahead and map out this site for me and show me what it looks like.

🔹 8️⃣ Versão mais estratégica (quando usa Plan Mode)⌗

Create a plan to scrape, map, and extract structured data from this website using the Firecrawl MCP server.

🎯 Estrutura padrão dos prompts usados⌗

Eles seguem esse padrão:

🔎 Contexto do que você quer
📊 Resultado esperado (structured data, screenshot, map)
🧠 Deixar Claude decidir quais ferramentas usar
📁 Pedir saída em formato específico (CSV, markdown, JSON)

firecrawl.dev ↗

branding.”

Retorna:

screenshot full page,
logo, favicon/OG image,
paleta de cores,
tipografia,
componentes/estilo.

B) Mapear um site inteiro⌗

Peça:

“Mapeie o site completo e mostre as principais seções.”

Retorna:

sitemap com páginas, categorias, coleções, produtos, guias etc. Depois disso, você pode:
dar crawl em uma seção específica,
extrair para banco,
montar dataset.

13) Rodar duas tarefas em paralelo (quando fizer sentido)⌗

Você pode abrir dois “agentes” no Claude Code:

um fazendo map
outro fazendo branding/screenshot ao mesmo tempo.

Passo a Passo

1) Entenda o objetivo⌗

Você quer transformar qualquer site em dados prontos para LLM, podendo gerar:

conteúdo (texto + metadados),
estrutura do site (mapa de URLs),
dados estruturados (tabela/CSV),
screenshots,
branding (logo, cores, tipografia).

2) Teste rápido no Playground do Firecrawl (opcional, mas recomendado)⌗

Abra o Playground do Firecrawl.
Cole a URL do site.
Selecione o formato de saída (ex.: Markdown, AI summary, Links, HTML, Screenshot, Branding, JSON).
Rode o scrape e confira o retorno para entender o que a ferramenta entrega.

3) Crie um projeto no VS Code⌗

Abra o VS Code.
Crie/abra uma pasta vazia (ex.: scraper/).
Deixe o projeto “limpo” (sem arquivos), para acompanhar tudo que será gerado.

4) Instale e conecte o Firecrawl via MCP no Claude Code⌗

Vá na documentação do Firecrawl e encontre a seção MCP Server.
Copie o comando de instalação para Claude Code (uma linha).
No Claude Code, peça para ele:

executar esse comando,
criar um arquivo .env,
e usar o .env para ler sua API key (sem você colar a chave no chat).

A ideia aqui é: MCP instalado + chave no .env = Claude pode chamar as ferramentas do Firecrawl automaticamente.

5) Coloque sua API Key no `.env`⌗

Abra o arquivo .env criado.
Pegue sua API key no painel (dashboard) do Firecrawl.
Cole no .env e salve.
Feche o arquivo.

Por que .env? Para manter a chave fora do histórico de conversa.

6) Recarregue o VS Code para “ativar” o MCP⌗

Pressione Ctrl + Shift + P
Execute Developer: Reload Window

Isso garante que o Claude Code passe a enxergar o MCP já configurado.

7) Faça um teste simples (sanity check)⌗

Peça para o Claude extrair uma página conhecida (algo direto, tipo “scrape essa URL e me devolva em markdown”).
Verifique se ele retorna o conteúdo e se realmente chamou a ferramenta correta (normalmente ele escolhe Scrape nesse teste).

8) Crie um “cheat sheet” de ferramentas (para o projeto ficar inteligente)⌗

Peça ao Claude para criar um arquivo markdown tipo:

firecrawl-cheatsheet.md

Esse arquivo deve conter:

quais ferramentas existem (Scrape/Map/Crawl/Search/Extract),
exemplos de uso,
um guia rápido de decisão (“quando usar cada uma”).

9) Crie um `CLAUDE.md` (prompt de sistema do projeto)⌗

Peça ao Claude para criar um arquivo CLAUDE.md dizendo que:

o projeto é para scraping e extração,
ele pode gerar screenshots, mapear e rastrear sites,
ele tem acesso ao MCP do Firecrawl,
e deve consultar o firecrawl-cheatsheet.md quando precisar.

A lógica:

CLAUDE.md = objetivo e regras gerais (curto)
cheatsheet = detalhes e referências (longo)

10) Use caso real: extrair muitas páginas (ex.: listagens)⌗

Quando o site tem muitas páginas (paginação), o fluxo recomendado é:

Scrape inicial Para entender a estrutura e os elementos da página.
Map Para descobrir todas as URLs (especialmente páginas paginadas).
Plano + perguntas O assistente deve alinhar:

Quantos itens você quer (ex.: 200 vs tudo),
Quais campos extrair,
Se quer descrição completa ou resumo.

Extract / Crawl

Se precisar ir página a página, usa Crawl.
Se quer dados estruturados, usa Extract.

Exportação Gerar saída em CSV (ideal para Google Sheets) com colunas como:

título, empresa, tipo, local, salário, experiência, categoria, data, URL, descrição, tags.

11) Autocorreção (quando algo não funciona)⌗

Se o Extract retornar vazio ou a página exigir mais “manejo”:

o assistente troca a abordagem automaticamente (ex.: usar um modo/agente mais robusto do Firecrawl, ajustar estratégia, trocar ordem de ferramentas etc.)
e tenta novamente até extrair.

12) Outros 2 fluxos prontos⌗

A) Screenshot + Branding⌗

Peça:

“Gere screenshots da página e extraia

3️⃣ Instalar o MCP no Claude Code⌗

Criar novo projeto no VS Code
Copiar comando MCP da documentação
Pedir para Claude instalar e conectar

4️⃣ Configurar segurança da API⌗

Criar arquivo .env
Inserir API key
Recarregar o VS Code

5️⃣ Testar se está funcionando⌗

Fazer um scrape simples
Confirmar que Claude chama automaticamente o endpoint correto

6️⃣ Organizar o projeto⌗

Criar:

🔹 Cheat Sheet⌗

Guia com:

Quais ferramentas existem
Quando usar cada uma

🔹 CLAUDE.md⌗

Define:

Objetivo do projeto
Acesso ao MCP
Referência ao cheat sheet

7️⃣ Caso prático 1 – Extração em escala⌗

Scrape inicial
Mapear o site
Criar plano
Fazer perguntas de refinamento
Executar extração
Exportar CSV estruturado

🔎 Destaque: autocorreção quando algo falha.

8️⃣ Caso prático 2 – Screenshot + Branding⌗

Gerar screenshot full page
Extrair logo, cores, tipografia

9️⃣ Caso prático 3 – Mapear site completo⌗

Gerar sitemap
Listar categorias e páginas
Preparar para crawl ou extração futura

🔟 Mostrar custo e escalabilidade⌗

Créditos usados
Diferença entre planos
Concorrência de requisições

🎯 Enfatizo⌗

Uso do MCP Server
Linguagem natural ao invés de configurar APIs manualmente
Workflow agentivo com autocorreção
Rapidez comparado a automações tradicionais
Baixo custo inicial

youtube.com/watch ↗

🎯 Tema Central⌗

Como transformar qualquer site em dados prontos para LLM (LLM-ready data) em segundos usando Claude Code + Firecrawl (MCP Server).

1️⃣ O Que o Firecrawl Faz⌗

Firecrawl permite:

Scrape → Extrair todo conteúdo de uma página
Map → Mapear todas as URLs e arquitetura do site
Crawl → Navegar e explorar múltiplas páginas
Search → Buscar no Google antes de extrair
Extract → Transformar conteúdo em dados estruturados

Formatos disponíveis:

Markdown
HTML
JSON
Screenshot da página
Branding (logo, cores, tipografia)
Resumo gerado por IA

O diferencial: usar o MCP Server, permitindo que Claude escolha automaticamente qual ferramenta usar com base em linguagem natural.

2️⃣ Demonstração no Playground⌗

No site firecrawl.dev:

Inserir URL
Escolher formato
Executar scrape

Resultado inclui:

Conteúdo completo em markdown
Resumo IA
Screenshot
Informações de branding
JSON estruturado

3️⃣ Integração com Claude Code⌗

Passos principais:⌗

Criar novo projeto no VS Code
Copiar comando MCP Server da documentação
Pedir para Claude conectar ao MCP
Criar arquivo .env
Inserir API Key
Reload do VS Code

Após isso, Claude consegue usar Firecrawl automaticamente.

4️⃣ Organização do Projeto⌗

Criados dois arquivos importantes:

🔹 firecrawl-cheatsheet.md⌗

Guia detalhado das ferramentas e quando usar cada uma.

🔹 CLAUDE.md⌗

Prompt de sistema do projeto explicando:

O objetivo (scraping)
Acesso ao MCP
Referência ao cheat sheet

Separação mantém o sistema limpo e organizado.

5️⃣ Caso de Uso 1 – 1.700 Vagas de Emprego⌗

Problema: Extrair 1.700 vagas distribuídas em 60+ páginas e transformar em planilha.

Fluxo do Claude:

Scrape inicial
Map do site
Criação de plano
Perguntas de refinamento
Execução
Autocorreção quando extract falhou

Resultado: CSV com 200 vagas contendo:

Título
Empresa
Tipo
Local
Salário
Experiência
Categoria
Data
URL
Descrição
Tags

🔥 Destaque: Agentic Workflow Claude detecta erro, ajusta estratégia e continua sozinho.

6️⃣ Caso de Uso 2 – Branding & Screenshot⌗

Prompt: “Pegue screenshots e analise o branding.”

Resultado:

Screenshot completa
Paleta de cores
Tipografia
Espaçamento
Componentes
Logo

Aplicações:

Análise competitiva
Briefing de design
Estudo de identidade visual

7️⃣ Caso de Uso 3 – Mapeamento de Site⌗

Prompt: “Mapeie esse site.”

Resultado:

Páginas principais
Categorias
Coleções
Produtos
Guias
Localizações

Depois é possível:

Fazer crawl específico
Extrair produtos
Construir banco de dados

8️⃣ Execução Paralela⌗

Dois agentes Claude rodando ao mesmo tempo:

Um mapeando site
Outro extraindo branding

Mostra capacidade de operações paralelas.

9️⃣ Custos⌗

Uso total na demo:

~30 créditos
De 500 gratuitos
Apenas 6%

Diferenças de planos:

Créditos
Número de páginas
Requisições simultâneas (2 no free, 5 no hobby, mais nos planos superiores)

🔟 Principais Insights⌗

Não é necessário configurar endpoints manualmente.
Claude decide automaticamente quais ferramentas usar.
Fluxo agentivo permite autocorreção.
Extremamente rápido comparado a automações tradicionais.
Baixo custo para uso inicial.

🚀 Conclusão⌗

Firecrawl + Claude Code permitem:

✔ Transformar qualquer site em dados estruturados
✔ Extrair grandes volumes rapidamente
✔ Fazer análise visual e estrutural
✔ Automatizar scraping complexo via linguagem natural
✔ Construir workflows de automação muito mais rápidos

Raspe tudo Que o Firecrawl Faz

chatgpt.com ↗

Tutorial completo sobre como usar Claude Code + Firecrawl MCP Server…

🎯 Objetivo Técnico⌗

🧠 Objetivo Estratégico⌗

💼 Objetivo Prático (Aplicações Reais)⌗

🚀 Objetivo Maior⌗

🧩 Resumo Final⌗

🔥 1️⃣ Não diga qual ferramenta usar⌗

🔥 2️⃣ Use Plan Mode para tarefas grandes⌗

🔥 3️⃣ Limite o volume primeiro⌗

🔥 4️⃣ Sempre peça saída estruturada explícita⌗

🔥 5️⃣ Use Map antes de Crawl (em sites grandes)⌗

🔥 6️⃣ Quando extract falhar⌗

🔥 7️⃣ Peça resumo em vez de descrição completa⌗

🔥 8️⃣ Combine tarefas em paralelo⌗

🔥 9️⃣ Peça sempre os links de origem⌗

🔥 🔟 Use o CLAUDE.md estrategicamente⌗

🚀 Hack avançado (nível profissional)⌗

🎯 Hack mental mais importante⌗

🔹 1️⃣ Conectar ao MCP do Firecrawl⌗

🔹 2️⃣ Testar se está funcionando⌗

🔹 3️⃣ Criar Cheat Sheet do Firecrawl⌗

🔹 4️⃣ Criar o CLAUDE.md (sistema do projeto)⌗

🔹 5️⃣ Caso prático – Extrair 1.700 vagas⌗

🔹 6️⃣ Screenshot + Branding⌗

🔹 7️⃣ Mapear um site completo⌗

🔹 8️⃣ Versão mais estratégica (quando usa Plan Mode)⌗

🎯 Estrutura padrão dos prompts usados⌗

B) Mapear um site inteiro⌗

13) Rodar duas tarefas em paralelo (quando fizer sentido)⌗

1) Entenda o objetivo⌗

2) Teste rápido no Playground do Firecrawl (opcional, mas recomendado)⌗

3) Crie um projeto no VS Code⌗

4) Instale e conecte o Firecrawl via MCP no Claude Code⌗

5) Coloque sua API Key no .env⌗

6) Recarregue o VS Code para “ativar” o MCP⌗

7) Faça um teste simples (sanity check)⌗

8) Crie um “cheat sheet” de ferramentas (para o projeto ficar inteligente)⌗

9) Crie um CLAUDE.md (prompt de sistema do projeto)⌗

10) Use caso real: extrair muitas páginas (ex.: listagens)⌗

11) Autocorreção (quando algo não funciona)⌗

12) Outros 2 fluxos prontos⌗

A) Screenshot + Branding⌗

3️⃣ Instalar o MCP no Claude Code⌗

4️⃣ Configurar segurança da API⌗

5️⃣ Testar se está funcionando⌗

6️⃣ Organizar o projeto⌗

🔹 Cheat Sheet⌗

🔹 CLAUDE.md⌗

7️⃣ Caso prático 1 – Extração em escala⌗

8️⃣ Caso prático 2 – Screenshot + Branding⌗

9️⃣ Caso prático 3 – Mapear site completo⌗

🔟 Mostrar custo e escalabilidade⌗

🎯 Enfatizo⌗

🎯 Tema Central⌗

1️⃣ O Que o Firecrawl Faz⌗

2️⃣ Demonstração no Playground⌗

3️⃣ Integração com Claude Code⌗

Passos principais:⌗

4️⃣ Organização do Projeto⌗

🔹 firecrawl-cheatsheet.md⌗

🔹 CLAUDE.md⌗

5️⃣ Caso de Uso 1 – 1.700 Vagas de Emprego⌗

6️⃣ Caso de Uso 2 – Branding & Screenshot⌗

7️⃣ Caso de Uso 3 – Mapeamento de Site⌗

8️⃣ Execução Paralela⌗

9️⃣ Custos⌗

🔟 Principais Insights⌗

🚀 Conclusão⌗

Recursos

5) Coloque sua API Key no `.env`⌗

9) Crie um `CLAUDE.md` (prompt de sistema do projeto)⌗