Qwen 3.6 vs DeepSeek V4

O Qwen 3.6 Plus lidera em benchmarks agênticos com resultados comprovados enquanto o DeepSeek V4 entra em cena

O DeepSeek V4, com a sua arquitetura MoE de ~1T de parâmetros e janela de contexto de 1M, representa um novo concorrente importante no panorama da IA. Mas o Qwen 3.6 Plus já lidera com benchmarks comprovados: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0 e o parâmetro preserve_thinking para fluxos de trabalho agênticos. A $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6), o Qwen 3.6 oferece uma relação preço-desempenho imbatível. O DeepSeek V4 Pro escala até 1,6T de parâmetros. O Qwen também disponibiliza modelos open-weight (27B com 77,2% SWE-bench, 35B A3B) para implementação local.

Benchmarks

Qwen 3.6 vs DeepSeek V4 - dados de benchmarks e especificações disponíveis

Comparação de benchmarks baseada em dados atualmente disponíveis. O Qwen 3.6 Plus lidera em benchmarks de programação agêntica com resultados comprovados em SWE-bench, Terminal-Bench, SkillsBench e avaliações de uso de ferramentas. Os dados do DeepSeek V4 serão atualizados à medida que mais resultados se tornem públicos.

O Qwen 3.6 Plus estabeleceu posições fortes em benchmarks de engenharia de software e programação agêntica, com o modelo open-weight 27B a entregar desempenho próximo do Plus. À medida que o DeepSeek V4 completa o seu lançamento, comparações mais abrangentes ficarão disponíveis. Os dados atuais mostram o Qwen 3.6 a liderar nos benchmarks agênticos principais com resultados comprovados e reproduzíveis e um ecossistema de implementação maduro.

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 vs DeepSeek V4 nos benchmarks disponíveis incluindo SWE-bench, Terminal-Bench e SkillsBench

Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (supera o Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Ambos os modelos: janela de contexto de 1M de tokens

Qwen 3.6 Plus: $0.40/$2.40 por M de tokens, lote com 50% de desconto

Tabela de benchmarks

Qwen 3.6 vs DeepSeek V4 - resultados atuais e especificações

Dados de benchmarks disponíveis para ambas as famílias de modelos. Os resultados do DeepSeek V4 serão atualizados à medida que mais dados se tornem públicos. Os resultados do Qwen 3.6 são de lançamentos oficiais com avaliações reproduzíveis.

Benchmark
Qwen 3.6 Plus
Proprietário
Disponível agora
Qwen 3.6 27B
Denso open-weight
Qwen 3.6 35B A3B
MoE open-weight
DeepSeek V4
~1T MoE
DeepSeek V4 Pro
1,6T MoE
SWE-bench Verified
Engenharia de software real
78.8%77.2%73.4%--
Terminal-Bench 2.0
Operações de terminal
61.659.351.5--
SkillsBench
Competências práticas de programação
-48.2---
LiveCodeBench
Geração de código competitiva
-83.980.4--
Claw-Eval Avg
Programação agêntica de ponta a ponta
-72.468.7--
Janela de contexto
Comprimento máximo de contexto
1M tokens128K tokens128K tokens1M tokens1M tokens
Arquitetura
Arquitetura do modelo
Proprietário27B Denso35B MoE (3B ativos)~1T MoE1,6T MoE
preserve_thinking
Persistência de raciocínio agêntico
SimNãoNãoNãoNão
Open-weight
Implementação local disponível
NãoSim (Apache 2.0)Sim (Apache 2.0)Por confirmarPor confirmar

Dados do Qwen 3.6 do lançamento oficial (março de 2026). Dados do DeepSeek V4 dos relatórios de lançamento inicial (abril de 2026). Alguns benchmarks do DeepSeek V4 pendentes de publicação completa.

Ecossistema Qwen

Desempenho agêntico comprovado, disponível hoje, com preços líderes do setor

O Qwen 3.6 está totalmente disponível com benchmarks comprovados, modelos open-weight sob Apache 2.0, preserve_thinking para fluxos de trabalho agênticos e preços a $0.40/$2.40 por milhão de tokens. Não esperes por benchmarks - começa a construir hoje.

Qwen 3.6 Plus

78,8% SWE-bench, $0.40/M de tokens

Experimentar Plus

Qwen 3.6 27B

77,2% SWE-bench, open-weight, Apache 2.0

Experimentar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, GPU de consumo

Experimentar 35B

Acesso API

Compatível com OpenAI, preserve_thinking, nível gratuito

Ver API

Executar localmente

Ollama, vLLM, llama.cpp, SGLang

Começar

Comunidade

Junta-te à comunidade de programadores Qwen

Aderir

Experimentar Qwen 3.6

Não esperes por benchmarks - experimenta desempenho agêntico comprovado hoje

O Qwen 3.6 está totalmente disponível com 78,8% SWE-bench, preserve_thinking e $0.40/$2.40 por milhão de tokens. Conversa gratuitamente, implementa localmente com modelos open-weight ou integra via API compatível com OpenAI. Funciona com Claude Code, OpenClaw, Aider e Continue.dev.