Qwen 3.6 27B vs 35B A3B

Potência densa vs eficiência MoE - escolhe o modelo open-weight que se adequa ao teu hardware e fluxo de trabalho

O Qwen 3.6 27B é um modelo denso com todos os 27B de parâmetros ativos, entregando o melhor desempenho open-weight em programação: 77,2% SWE-bench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 83,9 LiveCodeBench. Pode funcionar com 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV. O 35B A3B usa Mixture-of-Experts com apenas 3B de parâmetros ativos, alcançando 73,4% no SWE-bench enquanto funciona no Mac M4 16GB com quantização Q3 a 20-40 tok/s em hardware de consumo. Mesma família, mesma licença Apache 2.0, compromissos diferentes.

Benchmarks

Qwen 3.6 27B vs 35B A3B - comparação detalhada de benchmarks e hardware

Resultados abrangentes de benchmarks mostrando a diferença de desempenho entre as variantes densa e MoE em engenharia de software, programação, operações de terminal, raciocínio matemático, geração frontend e competências práticas de programação.

O modelo denso 27B supera consistentemente a variante MoE 35B A3B em todos os benchmarks, mas a diferença é moderada e previsível. O 35B A3B alcança aproximadamente 95% da qualidade do 27B enquanto requer apenas ~40% da computação e funciona 2-3x mais rápido. A pontuação do 27B no SkillsBench de 48,2 (superando o Claude 4.5 Opus com 45,3) destaca a sua força em julgamento de engenharia prático. Para utilizadores de Mac M4 16GB, o 35B A3B com Q3 é a escolha clara. Para utilizadores de estações de trabalho que priorizam qualidade, o 27B com IQ4_XS cabe em 16GB de VRAM.

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 27B vs 35B A3B em SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench, QwenWebBench e Claw-Eval

SWE-bench Verified: 77,2% (27B) vs 73,4% (35B A3B)

SkillsBench: 48,2 (27B) supera o Claude 4.5 Opus (45,3)

Terminal-Bench 2.0: 59,3 (27B) vs 51,5 (35B A3B)

35B A3B: 20-40 tok/s em hardware de consumo, Mac M4 16GB confirmado

27B IQ4_XS: cabe em 16GB de VRAM com compressão de cache KV (contexto 100K)

Tabela de benchmarks

27B Denso vs 35B A3B MoE - resultados completos com especificações de hardware

Comparação lado a lado de benchmarks com requisitos de hardware, velocidade de inferência e métricas de eficiência para ambos os modelos open-weight.

Benchmark
Qwen 3.6 27B
Denso (todos os parâmetros ativos)
Melhor qualidade
Qwen 3.6 35B A3B
MoE (3B ativos)
Melhor eficiência
SWE-bench Verified
Engenharia de software real
77.2%73.4%
Terminal-Bench 2.0
Operações de terminal
59.351.5
SkillsBench
Competências práticas de programação (Claude 4.5 Opus: 45,3)
48.2-
AIME 2025
Matemática de competição
94.1%92.7%
LiveCodeBench
Geração de código competitiva
83.980.4
QwenWebBench
Geração de código frontend
14871397
Claw-Eval Avg
Programação agêntica de ponta a ponta
72.468.7
NL2Repo
Linguagem natural para repositório
36.2-
Tamanho do modelo (FP16)
Tamanho dos pesos em precisão total
55,6 GB~70 GB total
VRAM mínima (quantizado)
Configuração mínima funcional
16 GB (IQ4_XS + cache KV)~17 GB (Q3_K_M)
VRAM recomendada
Operação confortável com contexto
24 GB (Q4_K_M)24 GB (Q4_K_M)
Parâmetros ativos
Parâmetros calculados por token
27B (todos)3B (de 35B)
Velocidade de inferência (4 bits)
tok/s em hardware de consumo
~10-15 tok/s20-40 tok/s
Mac M4 16GB
Portátil Apple Silicon
IQ4_XS (apertado)Q3_K_M (confirmado)

Dados de benchmarks dos cartões de modelo HuggingFace e lançamento oficial do Qwen 3.6. Benchmarks de hardware dos testes da comunidade Unsloth. Referência SkillsBench: Claude 4.5 Opus obtém 45,3.

Ecossistema Qwen

Dois modelos open-weight para cada cenário de implementação - licença Apache 2.0

Quer priorizes qualidade máxima (27B, 77,2% SWE-bench) ou eficiência de hardware (35B A3B, 20-40 tok/s em GPU de consumo), a família open-weight Qwen 3.6 tem o modelo certo. Ambos sob Apache 2.0 com suporte de visão, multimodal e chamada de ferramentas.

Qwen 3.6 27B

Denso, 77,2% SWE-bench, 48,2 SkillsBench

Transferir

Qwen 3.6 35B A3B

MoE, 73,4% SWE-bench, Mac M4 16GB

Transferir

Configuração Ollama

Implementação local com um comando para ambos os modelos

Começar

Modelos GGUF

Modelos quantizados para cada orçamento de VRAM

Explorar

Serviço vLLM

Implementação de produção com batching contínuo

Ler documentação

Comunidade

Obtém ajuda para escolher o modelo certo

Aderir

Começar

Pronto para escolher o teu modelo open-weight Qwen 3.6? Experimenta ambos gratuitamente

Experimenta ambos os modelos no navegador e depois transfere o que se adequa ao teu hardware. 27B para qualidade máxima (77,2% SWE-bench, supera o Claude no SkillsBench), 35B A3B para implementação em GPU de consumo (20-40 tok/s, Mac M4 16GB confirmado). Ambos com licença Apache 2.0.