Curadoria e resumo de vídeo de Mark Hashiff sobre o ecossistema de…
INEMA
Hacks de Decisão (Pain Meter)⌗
- Regra 80/100
- Use no-code para chegar em 60–80%.
- Exporte para Cursor/Claude Code para fechar os 100%.
- Exemplo: rascunho no Lovable → finalização no Cursor.
- Outcome > Ferramenta
- Escolha pelo resultado, não pela marca.
- Exemplo: workflows pequenos → Make; alto volume → n8n.
- Dor x Controle
- Mais dor (código) = mais controle.
- Só avance de camada quando a limitação for real.
Hacks de LLMs⌗
- Pontos Fortes
- OpenAI: multimodal, generalista.
- Anthropic: texto/código de alta qualidade.
- Gemini: grandes context windows, pesquisa.
- Meta/open source: custo/privacidade local.
- Prompt Sandwich
- Estrutura: Instruções + Contexto + Exemplos + Critérios + Validação.
- Janela antes do RAG
- Se o corpus cabe na janela do modelo, teste sem RAG antes.
Hacks de RAG e Vetores⌗
- Metadados Sempre
- Salve: id, origem, título, seção, timestamp, versão.
- Qdrant para Rastreamento
- Facilita updates/deletes sem resetar tudo.
- Re-ranking Barato
- Adicione re-ranking no pós-busca antes de trocar vetor store.
Hacks de Automação⌗
-
Regra de Custo
- Baixo volume: Make/Zapier.
- Alto volume: n8n self-host.
-
Nó de Agente com Limites
- Use só como orquestrador; tarefas críticas → HTTP/funções dedicadas.
-
Logging Mínimo
- Logue: input, decisão, output, custo por passo.
Hacks de Voz⌗
-
Sotaque e Latência
- Brasil variado → OpenAI Real-Time.
- Protótipo rápido → Vapi/Retell.
- Produção premium → ElevenLabs.
-
MCP como Superpoder
- Padronize funções (agenda, CRM, planilhas) e conecte ao agente de voz.
Hacks de Vibe Coding⌗
-
Evite Spaghetti
- Defina: pastas, .env, padrões antes de gerar.
-
Teste 3-Saltos
- A cada 3 cliques em “fix”: se piorar, pause e peça refatoração.
Hacks de Aprendizagem e Foco⌗
-
Pirâmide 3×3
- 3 LLMs + 3 automações + 3 casos reais.
- Domine isso por 30 dias, ignore o resto.
-
Exposição a Código
- Curso rápido (3h) de Python/JS → reconhecer padrões.
Checklists Rápidos⌗
Ingestão de Conhecimento [ ] Meta de uso [ ] Corpus e rotatividade [ ] Janela x RAG [ ] Metadados [ ] Re-ranking [ ] Testes/versão
Escolha de Automação [ ] Volume/mês [ ] Conectores nativos [ ] Custo por 1k runs [ ] Privacidade/self-host [ ] Código necessário [ ] Plano de migração
Deploy [ ] Logs e métricas [ ] Limites/timeout [ ] Retries/idempotência [ ] Custos por rota [ ] Alerta on-call
Mini-Plano (7 dias)⌗
- Dia 1–2: mapear 3 casos reais + refazer prompts (sandwich).
- Dia 3: escolher stack LLM + automação.
- Dia 4: POC sem RAG.
- Dia 5: adicionar RAG + re-ranking.
- Dia 6: instrumentar logs e custos.
- Dia 7: teste de carga + plano exportar para Cursor.
Visão Geral⌗
Apresenta um mapa mental do ecossistema da IA, com foco em como escolher ferramentas e modelos sem se perder no excesso de novidades. O autor, Mark Hashiff, defende que o problema não é escolher a ferramenta errada, mas não ter um framework de decisão.
Conceito Central: Pain Meter⌗
- Quanto menos dor (plataformas no-code fáceis e bonitas), menos controle.
- Quanto mais dor (exposição a código, configuração manual), mais controle e flexibilidade.
9 Categorias Principais⌗
- Modelos de Linguagem (LLMs)
- Base de tudo no espaço da IA.
- OpenAI = generalista e multimodal (texto, imagem, áudio).
- Anthropic = forte em texto e código.
- Gemini = vantagem pelo acesso a dados do Google e grandes context windows.
- Meta e open source = avanço rápido, permitindo rodar modelos localmente.
- Perplexity = especializado em pesquisa, com diferentes modos (Sonar, Deep Thinking etc.).
- Plataformas de Automação (Make, Zapier, n8n)
- Make e Zapier = fáceis, mas caros em escala.
- n8n = maior curva de aprendizado, mas barato e permite self-hosting.
- A escolha depende de volume, custo e necessidade de controle.
- Bancos de Dados e Vetores
- RAG nem sempre é necessário: context windows maiores já resolvem muita coisa.
- Pinecone = bom, mas difícil para gerenciar IDs e updates.
- Qdrant = mais controle e rastreabilidade dos vetores.
- Supabase = une banco relacional e vetorial.
- Alternativas: Airtable, Google Sheets ou PGVector.
- Voz e Agentes de Voz
- Vapi e Retell = rápidos para protótipos.
- ElevenLabs = vozes realistas e clonagem.
- OpenAI Real-Time API = ótimo para sotaques, custo caiu.
- LiveKit e Pipecat = controle total, open source, mas exigem mais técnica.
- Plataformas de Vibe Coding (Lovable, Bolt, Replit, Base44)
- Permitem criar apps só com prompts e UI simples.
- Limitadas a \~80% do produto; para chegar a 100% precisa exportar e usar Cursor ou Claude Code.
- Lovable = popular e em crescimento.
- Bolt = ficou famoso pelo hackathon milionário.
- Replit = infraestrutura robusta já existente.
- Base44 = ligado ao Wix.
- Agregadores e Super Apps (Manus, GenSpark)
- Reúnem vários modelos (texto, imagem, vídeo) em uma só interface.
- GenSpark agora inclui até desenvolvimento via prompts.
- Ferramentas Wrappers e Auxiliares
- Exemplo: Gamma (apresentações), Relevance AI (pequenos agentes).
- Servem para quem não quer mergulhar em código.
- Aprendizado de Linguagens (Python, JS)
- Não é para todos, mas vale pelo menos um curso rápido para reconhecer padrões.
- Facilita entender automações e plataformas.
- Comunidades e Coaching
- O autor criou o “Anti-Shiny Object Coach” (GPT personalizado) e a comunidade “Early AI Adopters”.
Etapas da Jornada⌗
- Iniciante: focar em LLMs + prompt engineering + wrappers.
- Tinkerer (curioso): escolher 1 automação (Make/Zapier/n8n).
- Construtor: criar primeiros fluxos e testar bancos vetoriais.
- Generalista: integrar voice, vibe coding, super apps.
- Top 1% Early Adopter: dominar tudo acima + explorar código (Cursor, Claude Code) e linguagens.
Conclusão⌗
- Não é preciso usar todas as ferramentas.
- O segredo é entender onde cada uma brilha e aplicá-la ao contexto certo.
- O conhecimento básico de prompts e modelos é o que mais evita distrações e perda de tempo com novidades irrelevantes.
Mapa das LLMs - From Mark
chatgpt.com ↗ gpt
1