Qwen 3.6 vs DeepSeek V4
Qwen 3.6 Plus in testa sui benchmark agentici con risultati comprovati mentre DeepSeek V4 entra in scena
DeepSeek V4, con la sua architettura MoE da ~1T parametri e finestra di contesto da 1M token, rappresenta un nuovo importante concorrente nel panorama AI. Ma Qwen 3.6 Plus è già in testa con benchmark comprovati: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0 e il parametro preserve_thinking per i flussi di lavoro agentici. A $0,40/$2,40 per milione di token (12 volte più economico di Claude Opus 4.6), Qwen 3.6 offre un rapporto prezzo-prestazioni imbattibile. DeepSeek V4 Pro scala fino a 1,6T parametri. Qwen offre anche modelli open-weight (27B con 77,2% SWE-bench, 35B A3B) per il deployment locale.
Benchmark
Qwen 3.6 vs DeepSeek V4 - dati benchmark e specifiche disponibili
Confronto benchmark basato sui dati attualmente disponibili. Qwen 3.6 Plus è in testa sui benchmark di coding agentico con risultati comprovati su SWE-bench, Terminal-Bench, SkillsBench e valutazioni sull'uso degli strumenti. I dati di DeepSeek V4 saranno aggiornati man mano che più risultati diventeranno pubblici.
Qwen 3.6 Plus ha stabilito posizioni solide nei benchmark di ingegneria del software e coding agentico, con il modello open-weight 27B che offre prestazioni vicine a Plus. Man mano che DeepSeek V4 completa il suo rilascio, saranno disponibili confronti più completi. I dati attuali mostrano Qwen 3.6 in testa sui benchmark agentici chiave con risultati comprovati e riproducibili e un ecosistema di deployment maturo.


Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0
Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (batte Claude 4.5 Opus)
Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval
Entrambi i modelli: finestra di contesto da 1M token
Qwen 3.6 Plus: $0,40/$2,40 per M token, batch al 50%
Tabella benchmark
Qwen 3.6 vs DeepSeek V4 - risultati e specifiche attuali
Dati benchmark disponibili per entrambe le famiglie di modelli. I risultati di DeepSeek V4 saranno aggiornati man mano che più dati diventeranno pubblici. I risultati di Qwen 3.6 provengono da rilasci ufficiali con valutazioni riproducibili.
| Benchmark | Qwen 3.6 Plus Proprietario Disponibile ora | Qwen 3.6 27B Denso open-weight | Qwen 3.6 35B A3B MoE open-weight | DeepSeek V4 ~1T MoE | DeepSeek V4 Pro 1.6T MoE |
|---|---|---|---|---|---|
SWE-bench Verified Ingegneria del software reale | 78.8% | 77.2% | 73.4% | - | - |
Terminal-Bench 2.0 Operazioni terminale | 61.6 | 59.3 | 51.5 | - | - |
SkillsBench Competenze pratiche di coding | - | 48.2 | - | - | - |
LiveCodeBench Generazione di codice competitiva | - | 83.9 | 80.4 | - | - |
Claw-Eval Avg Coding agentico end-to-end | - | 72.4 | 68.7 | - | - |
Context window Lunghezza massima del contesto | 1M tokens | 128K tokens | 128K tokens | 1M tokens | 1M tokens |
Architecture Architettura del modello | Proprietary | 27B Dense | 35B MoE (3B active) | ~1T MoE | 1.6T MoE |
preserve_thinking Persistenza del ragionamento agentico | Yes | No | No | No | No |
Open-weight Deployment locale disponibile | No | Yes (Apache 2.0) | Yes (Apache 2.0) | TBD | TBD |
Dati Qwen 3.6 dal rilascio ufficiale (marzo 2026). Dati DeepSeek V4 dai report di lancio iniziali (aprile 2026). Alcuni benchmark di DeepSeek V4 in attesa di pubblicazione completa.
Ecosistema Qwen
Prestazioni agentiche comprovate, disponibili oggi, a prezzi leader del settore
Qwen 3.6 è completamente disponibile con benchmark comprovati, modelli open-weight con licenza Apache 2.0, preserve_thinking per i flussi agentici e prezzi a $0,40/$2,40 per milione di token. Non aspettare i benchmark - inizia a costruire oggi.
Prova Qwen 3.6
Non aspettare i benchmark - prova oggi le prestazioni agentiche comprovate
Qwen 3.6 è completamente disponibile con 78,8% SWE-bench, preserve_thinking e $0,40/$2,40 per milione di token. Chatta gratis, esegui in locale con modelli open-weight o integra tramite l'API compatibile con OpenAI. Funziona con Claude Code, OpenClaw, Aider e Continue.dev.