Curadoria e resumo de vídeo de Mark Hashiff sobre o ecossistema de…

INEMA

youtube.com/watch ↗

Hacks de Decisão (Pain Meter)⌗

Regra 80/100

Use no-code para chegar em 60–80%.
Exporte para Cursor/Claude Code para fechar os 100%.
Exemplo: rascunho no Lovable → finalização no Cursor.

Outcome > Ferramenta

Escolha pelo resultado, não pela marca.
Exemplo: workflows pequenos → Make; alto volume → n8n.

Dor x Controle

Mais dor (código) = mais controle.
Só avance de camada quando a limitação for real.

Hacks de LLMs⌗

Pontos Fortes

OpenAI: multimodal, generalista.
Anthropic: texto/código de alta qualidade.
Gemini: grandes context windows, pesquisa.
Meta/open source: custo/privacidade local.

Prompt Sandwich

Estrutura: Instruções + Contexto + Exemplos + Critérios + Validação.

Janela antes do RAG

Se o corpus cabe na janela do modelo, teste sem RAG antes.

Hacks de RAG e Vetores⌗

Metadados Sempre

Salve: id, origem, título, seção, timestamp, versão.

Qdrant para Rastreamento

Facilita updates/deletes sem resetar tudo.

Re-ranking Barato

Adicione re-ranking no pós-busca antes de trocar vetor store.

Hacks de Automação⌗

Regra de Custo
- Baixo volume: Make/Zapier.
- Alto volume: n8n self-host.
Nó de Agente com Limites
- Use só como orquestrador; tarefas críticas → HTTP/funções dedicadas.
Logging Mínimo
- Logue: input, decisão, output, custo por passo.

Hacks de Voz⌗

Sotaque e Latência
- Brasil variado → OpenAI Real-Time.
- Protótipo rápido → Vapi/Retell.
- Produção premium → ElevenLabs.
MCP como Superpoder
- Padronize funções (agenda, CRM, planilhas) e conecte ao agente de voz.

Hacks de Vibe Coding⌗

Evite Spaghetti
- Defina: pastas, .env, padrões antes de gerar.
Teste 3-Saltos
- A cada 3 cliques em “fix”: se piorar, pause e peça refatoração.

Hacks de Aprendizagem e Foco⌗

Pirâmide 3×3
- 3 LLMs + 3 automações + 3 casos reais.
- Domine isso por 30 dias, ignore o resto.
Exposição a Código
- Curso rápido (3h) de Python/JS → reconhecer padrões.

Checklists Rápidos⌗

Ingestão de Conhecimento [ ] Meta de uso [ ] Corpus e rotatividade [ ] Janela x RAG [ ] Metadados [ ] Re-ranking [ ] Testes/versão

Escolha de Automação [ ] Volume/mês [ ] Conectores nativos [ ] Custo por 1k runs [ ] Privacidade/self-host [ ] Código necessário [ ] Plano de migração

Deploy [ ] Logs e métricas [ ] Limites/timeout [ ] Retries/idempotência [ ] Custos por rota [ ] Alerta on-call

Mini-Plano (7 dias)⌗

Dia 1–2: mapear 3 casos reais + refazer prompts (sandwich).
Dia 3: escolher stack LLM + automação.
Dia 4: POC sem RAG.
Dia 5: adicionar RAG + re-ranking.
Dia 6: instrumentar logs e custos.
Dia 7: teste de carga + plano exportar para Cursor.

Visão Geral⌗

Apresenta um mapa mental do ecossistema da IA, com foco em como escolher ferramentas e modelos sem se perder no excesso de novidades. O autor, Mark Hashiff, defende que o problema não é escolher a ferramenta errada, mas não ter um framework de decisão.

Conceito Central: Pain Meter⌗

Quanto menos dor (plataformas no-code fáceis e bonitas), menos controle.
Quanto mais dor (exposição a código, configuração manual), mais controle e flexibilidade.

9 Categorias Principais⌗

Modelos de Linguagem (LLMs)

Base de tudo no espaço da IA.
OpenAI = generalista e multimodal (texto, imagem, áudio).
Anthropic = forte em texto e código.
Gemini = vantagem pelo acesso a dados do Google e grandes context windows.
Meta e open source = avanço rápido, permitindo rodar modelos localmente.
Perplexity = especializado em pesquisa, com diferentes modos (Sonar, Deep Thinking etc.).

Plataformas de Automação (Make, Zapier, n8n)

Make e Zapier = fáceis, mas caros em escala.
n8n = maior curva de aprendizado, mas barato e permite self-hosting.
A escolha depende de volume, custo e necessidade de controle.

Bancos de Dados e Vetores

RAG nem sempre é necessário: context windows maiores já resolvem muita coisa.
Pinecone = bom, mas difícil para gerenciar IDs e updates.
Qdrant = mais controle e rastreabilidade dos vetores.
Supabase = une banco relacional e vetorial.
Alternativas: Airtable, Google Sheets ou PGVector.

Voz e Agentes de Voz

Vapi e Retell = rápidos para protótipos.
ElevenLabs = vozes realistas e clonagem.
OpenAI Real-Time API = ótimo para sotaques, custo caiu.
LiveKit e Pipecat = controle total, open source, mas exigem mais técnica.

Plataformas de Vibe Coding (Lovable, Bolt, Replit, Base44)

Permitem criar apps só com prompts e UI simples.
Limitadas a \~80% do produto; para chegar a 100% precisa exportar e usar Cursor ou Claude Code.
Lovable = popular e em crescimento.
Bolt = ficou famoso pelo hackathon milionário.
Replit = infraestrutura robusta já existente.
Base44 = ligado ao Wix.

Agregadores e Super Apps (Manus, GenSpark)

Reúnem vários modelos (texto, imagem, vídeo) em uma só interface.
GenSpark agora inclui até desenvolvimento via prompts.

Ferramentas Wrappers e Auxiliares

Exemplo: Gamma (apresentações), Relevance AI (pequenos agentes).
Servem para quem não quer mergulhar em código.

Aprendizado de Linguagens (Python, JS)

Não é para todos, mas vale pelo menos um curso rápido para reconhecer padrões.
Facilita entender automações e plataformas.

Comunidades e Coaching

O autor criou o “Anti-Shiny Object Coach” (GPT personalizado) e a comunidade “Early AI Adopters”.

Etapas da Jornada⌗

Iniciante: focar em LLMs + prompt engineering + wrappers.
Tinkerer (curioso): escolher 1 automação (Make/Zapier/n8n).
Construtor: criar primeiros fluxos e testar bancos vetoriais.
Generalista: integrar voice, vibe coding, super apps.
Top 1% Early Adopter: dominar tudo acima + explorar código (Cursor, Claude Code) e linguagens.

Conclusão⌗

Não é preciso usar todas as ferramentas.
O segredo é entender onde cada uma brilha e aplicá-la ao contexto certo.
O conhecimento básico de prompts e modelos é o que mais evita distrações e perda de tempo com novidades irrelevantes.

Mapa das LLMs - From Mark

chatgpt.com ↗ gpt

chatgpt.com ↗