Qwen 3.6 27B vs 35B A3B

Potência densa vs eficiência MoE - escolha o modelo open-weight que se encaixa no seu hardware e fluxo de trabalho

O Qwen 3.6 27B é um modelo denso com todos os 27B de parâmetros ativos, entregando o melhor desempenho open-weight em programação: 77,2% SWE-bench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 83,9 LiveCodeBench. Pode rodar em 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV. O 35B A3B usa Mixture-of-Experts com apenas 3B de parâmetros ativos, alcançando 73,4% SWE-bench enquanto roda no Mac M4 16GB com quantização Q3 a 20-40 tok/s em hardware de consumo. Mesma família, mesma licença Apache 2.0, tradeoffs diferentes.

Benchmarks

Qwen 3.6 27B vs 35B A3B - comparação detalhada de benchmarks e hardware

Resultados abrangentes de benchmarks mostrando a diferença de desempenho entre as variantes densa e MoE em engenharia de software, programação, operações de terminal, raciocínio matemático, geração frontend e habilidades práticas de programação.

O modelo denso 27B supera consistentemente a variante 35B A3B MoE em todos os benchmarks, mas a diferença é moderada e previsível. O 35B A3B alcança aproximadamente 95% da qualidade do 27B enquanto requer apenas ~40% da computação e rodando 2-3x mais rápido. A pontuação do 27B no SkillsBench de 48,2 (superando o Claude 4.5 Opus com 45,3) destaca sua força em julgamento prático de engenharia. Para usuários de Mac M4 16GB, o 35B A3B com Q3 é a escolha clara. Para usuários de workstation priorizando qualidade, o 27B com IQ4_XS cabe em 16GB de VRAM.

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 27B vs 35B A3B em SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench, QwenWebBench e Claw-Eval

SWE-bench Verified: 77,2% (27B) vs 73,4% (35B A3B)

SkillsBench: 48,2 (27B) supera o Claude 4.5 Opus (45,3)

Terminal-Bench 2.0: 59,3 (27B) vs 51,5 (35B A3B)

35B A3B: 20-40 tok/s em hardware de consumo, Mac M4 16GB confirmado

27B IQ4_XS: cabe em 16GB de VRAM com compressão de cache KV (contexto de 100K)

Tabela de benchmarks

27B Denso vs 35B A3B MoE - resultados completos com especificações de hardware

Comparação lado a lado de benchmarks com requisitos de hardware, velocidade de inferência e métricas de eficiência para ambos os modelos open-weight.

Benchmark
Qwen 3.6 27B
Denso (todos os parâmetros ativos)
Melhor qualidade
Qwen 3.6 35B A3B
MoE (3B ativos)
Melhor eficiência
SWE-bench Verified
Engenharia de software do mundo real
77.2%73.4%
Terminal-Bench 2.0
Operações de terminal
59.351.5
SkillsBench
Habilidades práticas de programação (Claude 4.5 Opus: 45,3)
48.2-
AIME 2025
Matemática de competição
94.1%92.7%
LiveCodeBench
Geração de código competitivo
83.980.4
QwenWebBench
Geração de código frontend
14871397
Claw-Eval Avg
Programação agêntica de ponta a ponta
72.468.7
NL2Repo
Linguagem natural para repositório
36.2-
Tamanho do modelo (FP16)
Tamanho dos pesos em precisão total
55,6 GB~70 GB total
VRAM mínima (quantizado)
Menor configuração funcional
16 GB (IQ4_XS + cache KV)~17 GB (Q3_K_M)
VRAM recomendada
Operação confortável com contexto
24 GB (Q4_K_M)24 GB (Q4_K_M)
Parâmetros ativos
Parâmetros computados por token
27B (todos)3B (de 35B)
Velocidade de inferência (4-bit)
tok/s em hardware de consumo
~10-15 tok/s20-40 tok/s
Mac M4 16GB
Laptop Apple Silicon
IQ4_XS (apertado)Q3_K_M (confirmado)

Dados de benchmark dos cards de modelo no HuggingFace e lançamento oficial do Qwen 3.6. Benchmarks de hardware dos testes da comunidade Unsloth. Referência SkillsBench: Claude 4.5 Opus pontua 45,3.

Ecossistema Qwen

Dois modelos open-weight para cada cenário de implantação - licenciados sob Apache 2.0

Seja priorizando qualidade máxima (27B, 77,2% SWE-bench) ou eficiência de hardware (35B A3B, 20-40 tok/s em GPU de consumo), a família open-weight Qwen 3.6 tem o modelo certo. Ambos sob Apache 2.0 com suporte a visão, multimodal e chamada de ferramentas.

Qwen 3.6 27B

Denso, 77,2% SWE-bench, 48,2 SkillsBench

Baixar

Qwen 3.6 35B A3B

MoE, 73,4% SWE-bench, Mac M4 16GB

Baixar

Configuração Ollama

Implantação local com um comando para ambos os modelos

Começar

Modelos GGUF

Modelos quantizados para cada orçamento de VRAM

Explorar

Servindo com vLLM

Implantação em produção com batching contínuo

Ler docs

Comunidade

Obtenha ajuda para escolher o modelo certo

Participar

Comece agora

Pronto para escolher seu modelo open-weight Qwen 3.6? Experimente ambos gratuitamente

Experimente ambos os modelos no navegador e depois baixe o que se encaixa no seu hardware. 27B para qualidade máxima (77,2% SWE-bench, supera o Claude no SkillsBench), 35B A3B para implantação em GPU de consumo (20-40 tok/s, Mac M4 16GB confirmado). Ambos licenciados sob Apache 2.0.