cerebro-vip INEMA.CLUB
inícioINEMA.LLMS

Curadoria e resumo de vídeo de Mark Hashiff sobre o ecossistema de…

INEMA.LLMS · 2025-09-04 · ~5 min · ver no Telegram ↗

INEMA

youtube.com/watch ↗

Hacks de Decisão (Pain Meter)

  1. Regra 80/100
  • Use no-code para chegar em 60–80%.
  • Exporte para Cursor/Claude Code para fechar os 100%.
  • Exemplo: rascunho no Lovable → finalização no Cursor.
  1. Outcome > Ferramenta
  • Escolha pelo resultado, não pela marca.
  • Exemplo: workflows pequenos → Make; alto volume → n8n.
  1. Dor x Controle
  • Mais dor (código) = mais controle.
  • Só avance de camada quando a limitação for real.

Hacks de LLMs

  1. Pontos Fortes
  • OpenAI: multimodal, generalista.
  • Anthropic: texto/código de alta qualidade.
  • Gemini: grandes context windows, pesquisa.
  • Meta/open source: custo/privacidade local.
  1. Prompt Sandwich
  • Estrutura: Instruções + Contexto + Exemplos + Critérios + Validação.
  1. Janela antes do RAG
  • Se o corpus cabe na janela do modelo, teste sem RAG antes.

Hacks de RAG e Vetores

  1. Metadados Sempre
  • Salve: id, origem, título, seção, timestamp, versão.
  1. Qdrant para Rastreamento
  • Facilita updates/deletes sem resetar tudo.
  1. Re-ranking Barato
  • Adicione re-ranking no pós-busca antes de trocar vetor store.

Hacks de Automação

  1. Regra de Custo

    • Baixo volume: Make/Zapier.
    • Alto volume: n8n self-host.
  2. Nó de Agente com Limites

    • Use só como orquestrador; tarefas críticas → HTTP/funções dedicadas.
  3. Logging Mínimo

    • Logue: input, decisão, output, custo por passo.

Hacks de Voz

  1. Sotaque e Latência

    • Brasil variado → OpenAI Real-Time.
    • Protótipo rápido → Vapi/Retell.
    • Produção premium → ElevenLabs.
  2. MCP como Superpoder

    • Padronize funções (agenda, CRM, planilhas) e conecte ao agente de voz.

Hacks de Vibe Coding

  1. Evite Spaghetti

    • Defina: pastas, .env, padrões antes de gerar.
  2. Teste 3-Saltos

    • A cada 3 cliques em “fix”: se piorar, pause e peça refatoração.

Hacks de Aprendizagem e Foco

  1. Pirâmide 3×3

    • 3 LLMs + 3 automações + 3 casos reais.
    • Domine isso por 30 dias, ignore o resto.
  2. Exposição a Código

    • Curso rápido (3h) de Python/JS → reconhecer padrões.

Checklists Rápidos

Ingestão de Conhecimento [ ] Meta de uso [ ] Corpus e rotatividade [ ] Janela x RAG [ ] Metadados [ ] Re-ranking [ ] Testes/versão

Escolha de Automação [ ] Volume/mês [ ] Conectores nativos [ ] Custo por 1k runs [ ] Privacidade/self-host [ ] Código necessário [ ] Plano de migração

Deploy [ ] Logs e métricas [ ] Limites/timeout [ ] Retries/idempotência [ ] Custos por rota [ ] Alerta on-call


Mini-Plano (7 dias)

  • Dia 1–2: mapear 3 casos reais + refazer prompts (sandwich).
  • Dia 3: escolher stack LLM + automação.
  • Dia 4: POC sem RAG.
  • Dia 5: adicionar RAG + re-ranking.
  • Dia 6: instrumentar logs e custos.
  • Dia 7: teste de carga + plano exportar para Cursor.

Visão Geral

Apresenta um mapa mental do ecossistema da IA, com foco em como escolher ferramentas e modelos sem se perder no excesso de novidades. O autor, Mark Hashiff, defende que o problema não é escolher a ferramenta errada, mas não ter um framework de decisão.

Conceito Central: Pain Meter

  • Quanto menos dor (plataformas no-code fáceis e bonitas), menos controle.
  • Quanto mais dor (exposição a código, configuração manual), mais controle e flexibilidade.

9 Categorias Principais

  1. Modelos de Linguagem (LLMs)
  • Base de tudo no espaço da IA.
  • OpenAI = generalista e multimodal (texto, imagem, áudio).
  • Anthropic = forte em texto e código.
  • Gemini = vantagem pelo acesso a dados do Google e grandes context windows.
  • Meta e open source = avanço rápido, permitindo rodar modelos localmente.
  • Perplexity = especializado em pesquisa, com diferentes modos (Sonar, Deep Thinking etc.).
  1. Plataformas de Automação (Make, Zapier, n8n)
  • Make e Zapier = fáceis, mas caros em escala.
  • n8n = maior curva de aprendizado, mas barato e permite self-hosting.
  • A escolha depende de volume, custo e necessidade de controle.
  1. Bancos de Dados e Vetores
  • RAG nem sempre é necessário: context windows maiores já resolvem muita coisa.
  • Pinecone = bom, mas difícil para gerenciar IDs e updates.
  • Qdrant = mais controle e rastreabilidade dos vetores.
  • Supabase = une banco relacional e vetorial.
  • Alternativas: Airtable, Google Sheets ou PGVector.
  1. Voz e Agentes de Voz
  • Vapi e Retell = rápidos para protótipos.
  • ElevenLabs = vozes realistas e clonagem.
  • OpenAI Real-Time API = ótimo para sotaques, custo caiu.
  • LiveKit e Pipecat = controle total, open source, mas exigem mais técnica.
  1. Plataformas de Vibe Coding (Lovable, Bolt, Replit, Base44)
  • Permitem criar apps só com prompts e UI simples.
  • Limitadas a \~80% do produto; para chegar a 100% precisa exportar e usar Cursor ou Claude Code.
  • Lovable = popular e em crescimento.
  • Bolt = ficou famoso pelo hackathon milionário.
  • Replit = infraestrutura robusta já existente.
  • Base44 = ligado ao Wix.
  1. Agregadores e Super Apps (Manus, GenSpark)
  • Reúnem vários modelos (texto, imagem, vídeo) em uma só interface.
  • GenSpark agora inclui até desenvolvimento via prompts.
  1. Ferramentas Wrappers e Auxiliares
  • Exemplo: Gamma (apresentações), Relevance AI (pequenos agentes).
  • Servem para quem não quer mergulhar em código.
  1. Aprendizado de Linguagens (Python, JS)
  • Não é para todos, mas vale pelo menos um curso rápido para reconhecer padrões.
  • Facilita entender automações e plataformas.
  1. Comunidades e Coaching
  • O autor criou o “Anti-Shiny Object Coach” (GPT personalizado) e a comunidade “Early AI Adopters”.

Etapas da Jornada

  • Iniciante: focar em LLMs + prompt engineering + wrappers.
  • Tinkerer (curioso): escolher 1 automação (Make/Zapier/n8n).
  • Construtor: criar primeiros fluxos e testar bancos vetoriais.
  • Generalista: integrar voice, vibe coding, super apps.
  • Top 1% Early Adopter: dominar tudo acima + explorar código (Cursor, Claude Code) e linguagens.

Conclusão

  • Não é preciso usar todas as ferramentas.
  • O segredo é entender onde cada uma brilha e aplicá-la ao contexto certo.
  • O conhecimento básico de prompts e modelos é o que mais evita distrações e perda de tempo com novidades irrelevantes.

Mapa das LLMs - From Mark

chatgpt.com ↗ gpt

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗