Qwen 3.6 vs Gemma 4

Qwen 3.6 lidera o Gemma 4 em benchmarks de programação, terminal, matemática e frontend

Comparação direta das famílias de modelos Qwen 3.6 e Google Gemma 4. O Qwen 3.6 35B A3B supera o Gemma 4 26B A4B no SWE-bench Verified (73,4% vs 52,0%), Terminal-Bench 2.0 (51,5 vs 42,9) e AIME 2025 (92,7% vs 88,3%). O modelo denso 27B amplia ainda mais a vantagem com 77,2% SWE-bench, 59,3 Terminal-Bench, 83,9 LiveCodeBench e 48,2 SkillsBench (superando o Claude 4.5 Opus com 45,3). Ambas as famílias oferecem variantes open-weight MoE e densas sob licenças permissivas.

Experimentar Qwen 3.6 Ver benchmarks

Benchmarks

Qwen 3.6 vs Gemma 4 - comparação detalhada de benchmarks em 8 avaliações

Resultados abrangentes de benchmarks comparando ambas as famílias de modelos em engenharia de software, programação, operações de terminal, raciocínio matemático, geração frontend e habilidades práticas de programação.

O Qwen 3.6 demonstra uma vantagem de desempenho significativa e consistente sobre o Gemma 4 em todos os benchmarks disponíveis. A diferença é particularmente pronunciada no SWE-bench Verified, onde o Qwen 3.6 lidera por mais de 20 pontos percentuais na comparação MoE e mais de 25 pontos com o modelo denso 27B. O resultado no SkillsBench (48,2 para o 27B, superando o Claude 4.5 Opus com 45,3) destaca a força do Qwen em julgamento prático de engenharia além da geração bruta de código.

Experimentar Qwen 3.6 Baixar modelos

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 vs Gemma 4 em SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench e QwenWebBench

SWE-bench Verified: Qwen 3.6 27B 77,2% vs Gemma 4 26B A4B 52,0% (+25,2pp)

Terminal-Bench 2.0: Qwen 3.6 27B 59,3 vs Gemma 4 26B A4B 42,9 (+38%)

AIME 2025: Qwen 3.6 35B A3B 92,7% vs Gemma 4 26B A4B 88,3%

SkillsBench: Qwen 3.6 27B 48,2 supera o Claude 4.5 Opus (45,3)

QwenWebBench: Qwen 3.6 27B 1487 - líder em geração de código frontend

Tabela de benchmarks

Qwen 3.6 vs Gemma 4 - resultados completos em todas as avaliações

Comparação lado a lado de benchmarks das variantes de modelos Qwen 3.6 e Gemma 4 em avaliações de engenharia de software, programação, matemática e habilidades práticas.

Benchmark	Qwen 3.6 27B Denso Melhor desempenho	Qwen 3.6 35B A3B MoE 3B ativos	Gemma 4 26B A4B MoE 4B ativos	Gemma 4 31B Denso
SWE-bench Verified Engenharia de software do mundo real	77.2%	73.4%	52.0%	-
Terminal-Bench 2.0 Operações de terminal e administração de sistemas	59.3	51.5	42.9	-
AIME 2025 Matemática de competição	94.1%	92.7%	88.3%	-
LiveCodeBench Geração de código competitivo	83.9	80.4	-	-
SkillsBench Habilidades práticas de programação	48.2	-	-	-
QwenWebBench Geração de código frontend	1487	1397	-	-
NL2Repo Linguagem natural para repositório	36.2	-	-	-
Claw-Eval Avg Programação agêntica de ponta a ponta	72.4	68.7	-	-
Parâmetros ativos Parâmetros computados por token	27B (todos)	3B (de 35B)	4B (de 26B)	31B (todos)

Resultados de benchmarks dos lançamentos oficiais dos modelos. Dados do Qwen 3.6 da Alibaba (março de 2026), dados do Gemma 4 do Google. Resultados do SkillsBench e QwenWebBench dos benchmarks oficiais do Qwen.

Ecossistema Qwen

Escolha a família de modelos que lidera nos benchmarks que mais importam

O Qwen 3.6 entrega desempenho significativamente superior ao Gemma 4 em engenharia de software (+25pp SWE-bench), operações de terminal (+38% Terminal-Bench) e raciocínio matemático. Tudo com menos parâmetros ativos e inferência mais rápida.

Explorar modelos Qwen Documentação oficial

Qwen 3.6 27B

Melhor modelo open-weight para código, 77,2% SWE-bench

Experimentar 27B

Qwen 3.6 35B A3B

MoE para GPU de consumo, 73,4% SWE-bench

Experimentar 35B

Executar localmente

Implante com Ollama, vLLM ou llama.cpp

Começar

Acesso à API

API compatível com OpenAI, $0.40/M tokens de entrada

Ver API

Comparação de modelos

Compare todos os modelos Qwen 3.6

Comparar

Comunidade

Participe da comunidade de desenvolvedores Qwen

Participar

Experimentar Qwen 3.6

Experimente a diferença de desempenho por conta própria - 25+ pontos à frente no SWE-bench

Converse com o Qwen 3.6 gratuitamente e veja por que ele lidera o Gemma 4 por mais de 25 pontos percentuais no SWE-bench, 38% no Terminal-Bench e supera o Claude 4.5 Opus no SkillsBench. Open-weight, implantável localmente e acessível via API.

Começar a Conversar Baixar modelos