Qwen 3.6 vs DeepSeek V4
O Qwen 3.6 Plus lidera em benchmarks agênticos com resultados comprovados enquanto o DeepSeek V4 entra em cena
O DeepSeek V4, com a sua arquitetura MoE de ~1T de parâmetros e janela de contexto de 1M, representa um novo concorrente importante no panorama da IA. Mas o Qwen 3.6 Plus já lidera com benchmarks comprovados: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0 e o parâmetro preserve_thinking para fluxos de trabalho agênticos. A $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6), o Qwen 3.6 oferece uma relação preço-desempenho imbatível. O DeepSeek V4 Pro escala até 1,6T de parâmetros. O Qwen também disponibiliza modelos open-weight (27B com 77,2% SWE-bench, 35B A3B) para implementação local.
Benchmarks
Qwen 3.6 vs DeepSeek V4 - dados de benchmarks e especificações disponíveis
Comparação de benchmarks baseada em dados atualmente disponíveis. O Qwen 3.6 Plus lidera em benchmarks de programação agêntica com resultados comprovados em SWE-bench, Terminal-Bench, SkillsBench e avaliações de uso de ferramentas. Os dados do DeepSeek V4 serão atualizados à medida que mais resultados se tornem públicos.
O Qwen 3.6 Plus estabeleceu posições fortes em benchmarks de engenharia de software e programação agêntica, com o modelo open-weight 27B a entregar desempenho próximo do Plus. À medida que o DeepSeek V4 completa o seu lançamento, comparações mais abrangentes ficarão disponíveis. Os dados atuais mostram o Qwen 3.6 a liderar nos benchmarks agênticos principais com resultados comprovados e reproduzíveis e um ecossistema de implementação maduro.


Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0
Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (supera o Claude 4.5 Opus)
Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval
Ambos os modelos: janela de contexto de 1M de tokens
Qwen 3.6 Plus: $0.40/$2.40 por M de tokens, lote com 50% de desconto
Tabela de benchmarks
Qwen 3.6 vs DeepSeek V4 - resultados atuais e especificações
Dados de benchmarks disponíveis para ambas as famílias de modelos. Os resultados do DeepSeek V4 serão atualizados à medida que mais dados se tornem públicos. Os resultados do Qwen 3.6 são de lançamentos oficiais com avaliações reproduzíveis.
| Benchmark | Qwen 3.6 Plus Proprietário Disponível agora | Qwen 3.6 27B Denso open-weight | Qwen 3.6 35B A3B MoE open-weight | DeepSeek V4 ~1T MoE | DeepSeek V4 Pro 1,6T MoE |
|---|---|---|---|---|---|
SWE-bench Verified Engenharia de software real | 78.8% | 77.2% | 73.4% | - | - |
Terminal-Bench 2.0 Operações de terminal | 61.6 | 59.3 | 51.5 | - | - |
SkillsBench Competências práticas de programação | - | 48.2 | - | - | - |
LiveCodeBench Geração de código competitiva | - | 83.9 | 80.4 | - | - |
Claw-Eval Avg Programação agêntica de ponta a ponta | - | 72.4 | 68.7 | - | - |
Janela de contexto Comprimento máximo de contexto | 1M tokens | 128K tokens | 128K tokens | 1M tokens | 1M tokens |
Arquitetura Arquitetura do modelo | Proprietário | 27B Denso | 35B MoE (3B ativos) | ~1T MoE | 1,6T MoE |
preserve_thinking Persistência de raciocínio agêntico | Sim | Não | Não | Não | Não |
Open-weight Implementação local disponível | Não | Sim (Apache 2.0) | Sim (Apache 2.0) | Por confirmar | Por confirmar |
Dados do Qwen 3.6 do lançamento oficial (março de 2026). Dados do DeepSeek V4 dos relatórios de lançamento inicial (abril de 2026). Alguns benchmarks do DeepSeek V4 pendentes de publicação completa.
Ecossistema Qwen
Desempenho agêntico comprovado, disponível hoje, com preços líderes do setor
O Qwen 3.6 está totalmente disponível com benchmarks comprovados, modelos open-weight sob Apache 2.0, preserve_thinking para fluxos de trabalho agênticos e preços a $0.40/$2.40 por milhão de tokens. Não esperes por benchmarks - começa a construir hoje.
Experimentar Qwen 3.6
Não esperes por benchmarks - experimenta desempenho agêntico comprovado hoje
O Qwen 3.6 está totalmente disponível com 78,8% SWE-bench, preserve_thinking e $0.40/$2.40 por milhão de tokens. Conversa gratuitamente, implementa localmente com modelos open-weight ou integra via API compatível com OpenAI. Funciona com Claude Code, OpenClaw, Aider e Continue.dev.