cerebro-vip INEMA.CLUB
inícioINEMA.LLMS

Explicação técnica comparativa das versões Qwen 2.5, Qwen 3 e Qwen…

INEMA.LLMS · 2026-02-27 · ~3 min · ver no Telegram ↗

INEMA

Vou explicar de forma direta e técnica, comparando:

  • 🔹 Qwen 2.5
  • 🔹 Qwen 3
  • 🔹 Qwen 3.5

🧠 Como funciona o Qwen 3.5

O Qwen 3.5 é um modelo Transformer (decoder-only), estilo GPT. Ele funciona assim:

  1. Tokenização → O texto é quebrado em tokens.
  2. Embedding → Cada token vira um vetor numérico.
  3. Camadas Transformer → Atenção multi-head + MLP processam contexto.
  4. Self-Attention → O modelo calcula a importância de cada token no contexto.
  5. Predição Autoregressiva → Gera o próximo token baseado nos anteriores.
  6. Fine-tuning + RLHF → Ajustado para seguir instruções e conversar melhor.

🚀 O que muda entre 2.5, 3 e 3.5

🔹 Qwen 2.5

Lançado como evolução do Qwen 2.

Características:

  • Melhor raciocínio que Qwen 2
  • Versões até 72B
  • Bom em código
  • Contexto longo (até 128K em algumas versões)
  • Ainda arquitetura Transformer tradicional otimizada

📌 Era forte, mas ainda atrás dos modelos topo de linha globais.


🔹 Qwen 3

Grande salto.

Melhorias:

  • Melhor raciocínio matemático
  • Melhor desempenho em benchmarks tipo MMLU, GSM8K
  • Treinamento com dados mais amplos e refinados
  • Melhor alinhamento
  • Otimizações para inferência

📌 Já começa a competir com modelos como GPT-4-level open models.


🔹 Qwen 3.5 (a evolução atual)

Aqui entra o upgrade real.

🔥 Principais melhorias:

1️⃣ Melhor raciocínio

  • Cadeia de pensamento mais estável
  • Menos “alucinação”
  • Melhor em problemas multi-etapas

2️⃣ Contexto extremamente longo

  • Até 256K tokens em algumas variantes
  • Ideal para documentos grandes, código longo, análise jurídica etc.

3️⃣ Melhor multimodalidade (em variantes VL)

  • Texto + imagem
  • Melhor compreensão visual

4️⃣ Versões MoE (Mixture of Experts)

Exemplo: 397B-A17B

  • 397B parâmetros totais
  • 17B ativos por inferência → Muito mais eficiente que modelos densos

5️⃣ Melhor performance em código

  • Qwen3.5-Coder é mais competitivo contra DeepSeek-Coder e CodeLlama

🏆 Resumindo

  • Qwen 2.5 → sólido, estável
  • Qwen 3 → grande salto em inteligência
  • Qwen 3.5 → refinamento + eficiência + contexto gigante + melhor raciocínio

Se você estiver pensando em:

  • 🔧 Rodar local → depende da GPU
  • 🖥 Servidor → 3.5 é melhor escolha
  • 📚 Processar documentos enormes → 3.5 ganha fácil
  • 💻 Programação → 3 ou 3.5 coder

Qwen3.5 é um repositório oficial no GitHub que contém informações e recursos da série de grandes modelos de linguagem Qwen3.5, desenvolvida pelo time Qwen da Alibaba Cloud.

📌 A licença do projeto é Apache-2.0 (aberta e permissiva).


🧠 Sobre o Qwen3.5 (modelo)

🔹 É uma evolução da família Qwen de LLMs (Tongyi Qianwen) com foco em:

  • texto, multimodalidade (texto + imagem/visão);
  • raciocínio avançado e capacidades de agent;
  • eficiência e cobertura global de idiomas.

🔹 A primeira versão aberta foi Qwen3.5-397B-A17B e, posteriormente, versões menores foram disponibilizadas (ex.: 122B, 35B, 27B).

🔹 O modelo suporta contexto muito longo (até 262 144+ tokens) e é projetado para tarefas como:

  • chat avançado;
  • desenvolvimento de agentes AI;
  • codificação, compreensão multimodal;
  • aplicações com longa memória de contexto. ([Hugging Face][4])

🔹 Os pesos estão disponíveis publicamente em plataformas como Hugging Face e ModelScope, com APIs compatíveis tipo OpenAI.


📌 Como usar / rodar

Embora o repositório GitHub em si não tenha código completo, é usado em conjunto com:

  • Hugging Face → onde os modelos podem ser baixados/servidos;
  • frameworks como vLLM, SGLang, transformers, llama.cpp para servir localmente.

Exemplo de uso na prática:

```transformers serve --port 8000 --continuous-batching

ou com vLLM:

vllm serve Qwen/Qwen3.5-35B-A3B --port 8000 …```

(Executa um servidor local compatível com APIs tipo OpenAI.)


✔️ Chat oficial: chat.qwen.ai ✔️ Modelos no Hugging Face ✔️ Documentação vinculada ✔️ Discussões e Issues para suporte comunitário

github.com/QwenLM/Qwen3.5 ↗ qwen.ai/research ↗ huggingface.co/Qwen/Qwen3.5-35B- ↗

Qwen 3.5

chatgpt.com ↗

1

Recursos

↑ voltar ao topo · ver no Telegram ↗