cerebro-vip INEMA.CLUB
inícioINEMA.IA CONCEITOS

Guia didático sobre as 8 configurações de parâmetros de LLMs no n8n,…

INEMA.IA CONCEITOS · 2025-06-15 · ~4 min · ver no Telegram ↗

INEMA

Aqui estão exemplos práticos para cada uma das configurações de modelos de IA no n8n, mostrando o que acontece na prática ao ajustar cada opção:


1. Frequency Penalty (Penalidade por Frequência)

  • Para que serve: Evita que a IA repita palavras ou frases.
  • Exemplo prático:

  • Sem penalidade (0.0): “Este curso é muito muito muito bom!”

  • Com penalidade alta (1.5): “Este curso é excelente e altamente recomendável.”

2. Max Number of Tokens (Número Máximo de Tokens)

  • Para que serve: Controla o tamanho da resposta.
  • Exemplo prático:

  • Baixo (50): “A Revolução Francesa começou em 1789 por…”

  • Alto (500): “A Revolução Francesa começou em 1789 por diversas razões, incluindo…” (resposta detalhada com vários parágrafos)

3. Response Format (Formato da Resposta)

  • Para que serve: Define se a resposta será texto simples, JSON, etc.
  • Exemplo prático:

  • Text: “O clima em Porto Alegre hoje é ensolarado com máxima de 28 °C.”

  • JSON:

    { "cidade": "Porto Alegre", "clima": "ensolarado", "maxima": 28 }


4. Presence Penalty (Penalidade por Presença)

  • Para que serve: Evita que a IA repita qualquer palavra, incentivando diversidade.
  • Exemplo prático:

  • Sem penalidade (0.0): “O sol brilha, o sol aquece, o sol ilumina.”

  • Com penalidade (1.0): “O astro aquece, irradia luz e traz calor.” (evita repetir "sol")

5. Sampling Temperature (Temperatura de Amostragem)

  • Para que serve: Controla a criatividade (aleatoriedade) da resposta.
  • Exemplo prático:

  • Baixo (0.2): “A água ferve a 100 °C ao nível do mar.” (fato direto e preciso)

  • Alto (1.0): “A água, essa dança líquida, atinge o seu auge borbulhante a 100 °C.”

6. Timeout (Tempo Máximo de Espera)

  • Para que serve: Define quanto tempo o sistema espera pela resposta.
  • Exemplo prático:

  • Baixo (3000 ms): Em consultas longas, a IA pode falhar ou não responder a tempo.

  • Alto (15000 ms): A IA consegue responder mesmo se o servidor estiver mais lento.

7. Max Retries (Tentativas Máximas)

  • Para que serve: Tenta de novo em caso de falha.
  • Exemplo prático:

  • 1 tentativa: Se falhar por instabilidade, não tenta novamente.

  • 3 tentativas: Reenvia até 3 vezes antes de desistir, útil em redes instáveis.

8. Top P (Probabilidade Acumulada)

  • Para que serve: Controla a diversidade das palavras escolhidas.
  • Exemplo prático:

  • Top P = 0.8: “O cachorro correu no parque.” (resposta mais comum e direta)

  • Top P = 1.0: “O cão disparou alegremente pela grama verde do parque urbano.” (resposta mais variada e criativa)

Explicação das Opções do Modelo de IA

Aqui está o que cada opção do modelo de IA no n8n faz, junto com exemplos de quando você pode querer ajustá-las:


Frequency Penalty (Penalidade por Frequência)

  • O que faz: Desencoraja o modelo a repetir as mesmas palavras ou frases. Valores mais altos (até 2.0) reduzem repetições; valores negativos incentivam repetições.
  • Quando mudar: Se as respostas estiverem repetitivas (ex: “muito muito muito importante”), aumente a penalidade. Para poesia ou textos técnicos onde a repetição é útil, use um valor menor ou negativo.

Maximum Number of Tokens (Número Máximo de Tokens)

  • O que faz: Define o comprimento máximo da resposta, em tokens (cada token ≈ 4 caracteres ou ¾ de uma palavra).
  • Quando mudar: Para respostas curtas, use um limite baixo. Para textos longos (ensaios, relatórios), aumente o limite. Se definido como -1, pode significar "sem limite explícito", mas depende do modelo usado.

Response Format (Formato da Resposta)

  • O que faz: Especifica o tipo de saída (texto simples, JSON, etc.).
  • Quando mudar: Use "Text" para respostas em linguagem natural ou "JSON" se quiser dados estruturados para processamentos adicionais.

Presence Penalty (Penalidade por Presença)

  • O que faz: Penaliza o uso repetido de palavras, mesmo que usadas apenas uma vez, incentivando vocabulário mais variado.
  • Quando mudar: Aumente para mais criatividade (brainstorming, escrita criativa). Diminua para consistência em tarefas técnicas.

Sampling Temperature (Temperatura de Amostragem)

  • O que faz: Controla a aleatoriedade da resposta. Valores baixos (<1) tornam as respostas mais previsíveis; valores altos (>1) geram mais criatividade.
  • Quando mudar: Use valores baixos (0.2–0.5) para respostas factuais. Use valores altos (0.8–1.2) para conteúdo criativo.

Timeout (Tempo Máximo de Espera)

  • O que faz: Define o tempo máximo (em milissegundos) que o sistema espera uma resposta antes de cancelar.
  • Quando mudar: Aumente em consultas complexas ou com servidores lentos. Reduza em aplicações que exigem resposta rápida, como chatbots.

Max Retries (Número Máximo de Tentativas)

  • O que faz: Quantas vezes o sistema tentará uma solicitação com erro antes de desistir.
  • Quando mudar: Aumente para maior robustez em redes instáveis. Reduza para obter falhas mais rápidas.

Top P

  • O que faz: Controla a diversidade da saída considerando somente o conjunto de palavras mais prováveis com soma de probabilidades ≥ valor de P (ex: 0.9).
  • Quando mudar: Use valores menores (ex: 0.8) para respostas mais focadas e valores maiores (ex: 1.0) para respostas mais variadas.
  • Nota: Recomenda-se ajustar temperature ou top P, mas não os dois ao mesmo tempo.

Cenários de Exemplo

Para um assistente de escrita criativa:

  • Aumente a Sampling Temperature para 1.0.
  • Aumente o Top P para 0.95.
  • Aumente a Presence Penalty para vocabulário único.
  • Aumente o Max Tokens para histórias mais longas.

Para um bot de perguntas técnicas:

  • Diminua a Sampling Temperature para 0.3.
  • Diminua o Top P para 0.8.
  • Mantenha penalidades de frequência e presença baixas para clareza.

8 Configurações de LLMs

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗