Qwen 3.6 vs DeepSeek V4

Qwen 3.6 Plus lidera em benchmarks agênticos com resultados comprovados enquanto o DeepSeek V4 entra na arena

O DeepSeek V4, com sua arquitetura MoE de ~1T de parâmetros e janela de contexto de 1M, representa um novo concorrente importante no cenário de IA. Mas o Qwen 3.6 Plus já lidera com benchmarks comprovados: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0 e o parâmetro preserve_thinking para fluxos agênticos. A $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6), o Qwen 3.6 oferece custo-benefício incomparável. O DeepSeek V4 Pro escala para 1,6T de parâmetros. O Qwen também oferece modelos open-weight (27B com 77,2% SWE-bench, 35B A3B) para implantação local.

Benchmarks

Qwen 3.6 vs DeepSeek V4 - dados de benchmark e especificações disponíveis

Comparação de benchmarks baseada em dados atualmente disponíveis. O Qwen 3.6 Plus lidera em benchmarks de programação agêntica com resultados comprovados em SWE-bench, Terminal-Bench, SkillsBench e avaliações de uso de ferramentas. Os dados do DeepSeek V4 serão atualizados conforme mais resultados se tornem públicos.

O Qwen 3.6 Plus estabeleceu posições fortes em benchmarks de engenharia de software e programação agêntica, com o modelo open-weight 27B entregando desempenho próximo ao Plus. Conforme o DeepSeek V4 completa seu lançamento, comparações mais abrangentes ficarão disponíveis. Os dados atuais mostram o Qwen 3.6 liderando nos benchmarks agênticos principais com resultados comprovados e reproduzíveis e um ecossistema de implantação maduro.

Gráfico de comparação de benchmarks mostrando o desempenho do Qwen 3.6 vs DeepSeek V4 em benchmarks disponíveis incluindo SWE-bench, Terminal-Bench e SkillsBench

Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (supera o Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Ambos os modelos: janela de contexto de 1M de tokens

Qwen 3.6 Plus: $0.40/$2.40 por M de tokens, lote com 50% de desconto

Tabela de benchmarks

Qwen 3.6 vs DeepSeek V4 - resultados atuais e especificações

Dados de benchmark disponíveis para ambas as famílias de modelos. Os resultados do DeepSeek V4 serão atualizados conforme mais dados se tornem públicos. Os resultados do Qwen 3.6 são de lançamentos oficiais com avaliações reproduzíveis.

Benchmark
Qwen 3.6 Plus
Proprietário
Disponível agora
Qwen 3.6 27B
Open-weight denso
Qwen 3.6 35B A3B
Open-weight MoE
DeepSeek V4
~1T MoE
DeepSeek V4 Pro
1,6T MoE
SWE-bench Verified
Engenharia de software do mundo real
78.8%77.2%73.4%--
Terminal-Bench 2.0
Operações de terminal
61.659.351.5--
SkillsBench
Habilidades práticas de programação
-48.2---
LiveCodeBench
Geração de código competitivo
-83.980.4--
Claw-Eval Avg
Programação agêntica de ponta a ponta
-72.468.7--
Janela de contexto
Comprimento máximo de contexto
1M tokens128K tokens128K tokens1M tokens1M tokens
Arquitetura
Arquitetura do modelo
Proprietário27B Denso35B MoE (3B ativos)~1T MoE1,6T MoE
preserve_thinking
Persistência de raciocínio agêntico
SimNãoNãoNãoNão
Open-weight
Implantação local disponível
NãoSim (Apache 2.0)Sim (Apache 2.0)A confirmarA confirmar

Dados do Qwen 3.6 do lançamento oficial (março de 2026). Dados do DeepSeek V4 dos relatórios iniciais de lançamento (abril de 2026). Alguns benchmarks do DeepSeek V4 aguardando publicação completa.

Ecossistema Qwen

Desempenho agêntico comprovado, disponível hoje, com preços líderes do setor

O Qwen 3.6 está totalmente disponível com benchmarks comprovados, modelos open-weight sob Apache 2.0, preserve_thinking para fluxos agênticos e preços de $0.40/$2.40 por milhão de tokens. Não espere por benchmarks - comece a construir hoje.

Qwen 3.6 Plus

78,8% SWE-bench, $0.40/M de tokens

Experimentar Plus

Qwen 3.6 27B

77,2% SWE-bench, open-weight, Apache 2.0

Experimentar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, GPU de consumo

Experimentar 35B

Acesso à API

Compatível com OpenAI, preserve_thinking, nível gratuito

Ver API

Executar localmente

Ollama, vLLM, llama.cpp, SGLang

Começar

Comunidade

Participe da comunidade de desenvolvedores Qwen

Participar

Experimentar Qwen 3.6

Não espere por benchmarks - experimente desempenho agêntico comprovado hoje

O Qwen 3.6 está totalmente disponível com 78,8% SWE-bench, preserve_thinking e $0.40/$2.40 por milhão de tokens. Converse gratuitamente, implante localmente com modelos open-weight ou integre via API compatível com OpenAI. Funciona com Claude Code, OpenClaw, Aider e Continue.dev.