Qwen 3.6 vs DeepSeek V4

Qwen 3.6 Plus in testa sui benchmark agentici con risultati comprovati mentre DeepSeek V4 entra in scena

DeepSeek V4, con la sua architettura MoE da ~1T parametri e finestra di contesto da 1M token, rappresenta un nuovo importante concorrente nel panorama AI. Ma Qwen 3.6 Plus è già in testa con benchmark comprovati: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0 e il parametro preserve_thinking per i flussi di lavoro agentici. A $0,40/$2,40 per milione di token (12 volte più economico di Claude Opus 4.6), Qwen 3.6 offre un rapporto prezzo-prestazioni imbattibile. DeepSeek V4 Pro scala fino a 1,6T parametri. Qwen offre anche modelli open-weight (27B con 77,2% SWE-bench, 35B A3B) per il deployment locale.

Benchmark

Qwen 3.6 vs DeepSeek V4 - dati benchmark e specifiche disponibili

Confronto benchmark basato sui dati attualmente disponibili. Qwen 3.6 Plus è in testa sui benchmark di coding agentico con risultati comprovati su SWE-bench, Terminal-Bench, SkillsBench e valutazioni sull'uso degli strumenti. I dati di DeepSeek V4 saranno aggiornati man mano che più risultati diventeranno pubblici.

Qwen 3.6 Plus ha stabilito posizioni solide nei benchmark di ingegneria del software e coding agentico, con il modello open-weight 27B che offre prestazioni vicine a Plus. Man mano che DeepSeek V4 completa il suo rilascio, saranno disponibili confronti più completi. I dati attuali mostrano Qwen 3.6 in testa sui benchmark agentici chiave con risultati comprovati e riproducibili e un ecosistema di deployment maturo.

Grafico di confronto benchmark che mostra le prestazioni di Qwen 3.6 vs DeepSeek V4 sui benchmark disponibili tra cui SWE-bench, Terminal-Bench e SkillsBench

Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (batte Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Entrambi i modelli: finestra di contesto da 1M token

Qwen 3.6 Plus: $0,40/$2,40 per M token, batch al 50%

Tabella benchmark

Qwen 3.6 vs DeepSeek V4 - risultati e specifiche attuali

Dati benchmark disponibili per entrambe le famiglie di modelli. I risultati di DeepSeek V4 saranno aggiornati man mano che più dati diventeranno pubblici. I risultati di Qwen 3.6 provengono da rilasci ufficiali con valutazioni riproducibili.

Benchmark
Qwen 3.6 Plus
Proprietario
Disponibile ora
Qwen 3.6 27B
Denso open-weight
Qwen 3.6 35B A3B
MoE open-weight
DeepSeek V4
~1T MoE
DeepSeek V4 Pro
1.6T MoE
SWE-bench Verified
Ingegneria del software reale
78.8%77.2%73.4%--
Terminal-Bench 2.0
Operazioni terminale
61.659.351.5--
SkillsBench
Competenze pratiche di coding
-48.2---
LiveCodeBench
Generazione di codice competitiva
-83.980.4--
Claw-Eval Avg
Coding agentico end-to-end
-72.468.7--
Context window
Lunghezza massima del contesto
1M tokens128K tokens128K tokens1M tokens1M tokens
Architecture
Architettura del modello
Proprietary27B Dense35B MoE (3B active)~1T MoE1.6T MoE
preserve_thinking
Persistenza del ragionamento agentico
YesNoNoNoNo
Open-weight
Deployment locale disponibile
NoYes (Apache 2.0)Yes (Apache 2.0)TBDTBD

Dati Qwen 3.6 dal rilascio ufficiale (marzo 2026). Dati DeepSeek V4 dai report di lancio iniziali (aprile 2026). Alcuni benchmark di DeepSeek V4 in attesa di pubblicazione completa.

Ecosistema Qwen

Prestazioni agentiche comprovate, disponibili oggi, a prezzi leader del settore

Qwen 3.6 è completamente disponibile con benchmark comprovati, modelli open-weight con licenza Apache 2.0, preserve_thinking per i flussi agentici e prezzi a $0,40/$2,40 per milione di token. Non aspettare i benchmark - inizia a costruire oggi.

Qwen 3.6 Plus

78,8% SWE-bench, $0,40/M token

Prova Plus

Qwen 3.6 27B

77,2% SWE-bench, open-weight, Apache 2.0

Prova il 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, GPU consumer

Prova il 35B

Accesso API

Compatibile con OpenAI, preserve_thinking, livello gratuito

Vedi API

Esegui in locale

Ollama, vLLM, llama.cpp, SGLang

Inizia

Community

Unisciti alla community degli sviluppatori Qwen

Unisciti

Prova Qwen 3.6

Non aspettare i benchmark - prova oggi le prestazioni agentiche comprovate

Qwen 3.6 è completamente disponibile con 78,8% SWE-bench, preserve_thinking e $0,40/$2,40 per milione di token. Chatta gratis, esegui in locale con modelli open-weight o integra tramite l'API compatibile con OpenAI. Funziona con Claude Code, OpenClaw, Aider e Continue.dev.