Qwen 3.6 vs Gemma 4

O Qwen 3.6 lidera o Gemma 4 em programação, terminal, matemática e benchmarks de frontend

Comparação direta das famílias de modelos Qwen 3.6 e Google Gemma 4. O Qwen 3.6 35B A3B supera o Gemma 4 26B A4B no SWE-bench Verified (73,4% vs 52,0%), Terminal-Bench 2.0 (51,5 vs 42,9) e AIME 2025 (92,7% vs 88,3%). O modelo denso 27B amplia ainda mais a vantagem com 77,2% SWE-bench, 59,3 Terminal-Bench, 83,9 LiveCodeBench e 48,2 SkillsBench (superando o Claude 4.5 Opus com 45,3). Ambas as famílias oferecem variantes open-weight MoE e densas sob licenças permissivas.

Experimentar Qwen 3.6 Ver benchmarks

Benchmarks

Qwen 3.6 vs Gemma 4 - comparação detalhada de benchmarks em 8 avaliações

Resultados abrangentes de benchmarks comparando ambas as famílias de modelos em engenharia de software, programação, operações de terminal, raciocínio matemático, geração frontend e competências práticas de programação.

O Qwen 3.6 demonstra uma vantagem de desempenho significativa e consistente sobre o Gemma 4 em todos os benchmarks disponíveis. A diferença é particularmente pronunciada no SWE-bench Verified, onde o Qwen 3.6 lidera por mais de 20 pontos percentuais na comparação MoE e mais de 25 pontos com o modelo denso 27B. O resultado no SkillsBench (48,2 para o 27B, superando o Claude 4.5 Opus com 45,3) destaca a força do Qwen em julgamento de engenharia prático para além da geração de código pura.

Experimentar Qwen 3.6 Transferir modelos

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 vs Gemma 4 em SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench e QwenWebBench

SWE-bench Verified: Qwen 3.6 27B 77,2% vs Gemma 4 26B A4B 52,0% (+25,2pp)

Terminal-Bench 2.0: Qwen 3.6 27B 59,3 vs Gemma 4 26B A4B 42,9 (+38%)

AIME 2025: Qwen 3.6 35B A3B 92,7% vs Gemma 4 26B A4B 88,3%

SkillsBench: Qwen 3.6 27B 48,2 supera o Claude 4.5 Opus (45,3)

QwenWebBench: Qwen 3.6 27B 1487 - líder em geração de código frontend

Tabela de benchmarks

Qwen 3.6 vs Gemma 4 - resultados completos em todas as avaliações

Comparação lado a lado de benchmarks das variantes de modelos Qwen 3.6 e Gemma 4 em avaliações de engenharia de software, programação, matemática e competências práticas.

Benchmark	Qwen 3.6 27B Denso Melhor desempenho	Qwen 3.6 35B A3B MoE 3B ativos	Gemma 4 26B A4B MoE 4B ativos	Gemma 4 31B Denso
SWE-bench Verified Engenharia de software real	77.2%	73.4%	52.0%	-
Terminal-Bench 2.0 Operações de terminal e administração de sistemas	59.3	51.5	42.9	-
AIME 2025 Matemática de competição	94.1%	92.7%	88.3%	-
LiveCodeBench Geração de código competitiva	83.9	80.4	-	-
SkillsBench Competências práticas de programação	48.2	-	-	-
QwenWebBench Geração de código frontend	1487	1397	-	-
NL2Repo Linguagem natural para repositório	36.2	-	-	-
Claw-Eval Avg Programação agêntica de ponta a ponta	72.4	68.7	-	-
Parâmetros ativos Parâmetros calculados por token	27B (todos)	3B (de 35B)	4B (de 26B)	31B (todos)

Resultados de benchmarks dos lançamentos oficiais dos modelos. Dados do Qwen 3.6 da Alibaba (março de 2026), dados do Gemma 4 da Google. Resultados do SkillsBench e QwenWebBench dos benchmarks oficiais do Qwen.

Ecossistema Qwen

Escolhe a família de modelos que lidera nos benchmarks que mais importam

O Qwen 3.6 entrega desempenho significativamente superior ao Gemma 4 em engenharia de software (+25pp SWE-bench), operações de terminal (+38% Terminal-Bench) e raciocínio matemático. Tudo com menos parâmetros ativos e inferência mais rápida.

Explorar modelos Qwen Documentação oficial

Qwen 3.6 27B

Melhor modelo open-weight para programação, 77,2% SWE-bench

Experimentar 27B

Qwen 3.6 35B A3B

MoE para GPU de consumo, 73,4% SWE-bench

Experimentar 35B

Executar localmente

Implementa com Ollama, vLLM ou llama.cpp

Começar

Acesso API

API compatível com OpenAI, $0.40/M tokens de entrada

Ver API

Comparação de modelos

Compara todos os modelos Qwen 3.6

Comparar

Comunidade

Junta-te à comunidade de programadores Qwen

Aderir

Experimentar Qwen 3.6

Experimenta a diferença de desempenho por ti próprio - mais de 25 pontos à frente no SWE-bench

Conversa com o Qwen 3.6 gratuitamente e descobre porque lidera o Gemma 4 por mais de 25 pontos percentuais no SWE-bench, 38% no Terminal-Bench e supera o Claude 4.5 Opus no SkillsBench. Open-weight, implementável localmente e acessível por API.

Começar a Conversar Transferir modelos