Qwen 3.6 vs DeepSeek V4
Qwen 3.6 Plus führt bei agentischen Benchmarks mit bewiesenen Ergebnissen, während DeepSeek V4 die Arena betritt
DeepSeek V4 mit seiner ~1T-Parameter-MoE-Architektur und 1M-Kontextfenster ist ein bedeutender neuer Herausforderer in der KI-Landschaft. Doch Qwen 3.6 Plus führt bereits mit bewiesenen Benchmarks: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0 und dem preserve_thinking-Parameter für agentische Workflows. Mit $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6) bietet Qwen 3.6 ein unübertroffenes Preis-Leistungs-Verhältnis. DeepSeek V4 Pro skaliert auf 1,6T Parameter. Qwen stellt zudem Open-Weight-Modelle bereit (27B mit 77,2 % SWE-bench, 35B A3B) für lokales Deployment.
Benchmarks
Qwen 3.6 vs DeepSeek V4 - verfügbare Benchmark-Daten und Spezifikationen
Benchmark-Vergleich basierend auf aktuell verfügbaren Daten. Qwen 3.6 Plus führt bei agentischen Coding-Benchmarks mit bewiesenen Ergebnissen bei SWE-bench, Terminal-Bench, SkillsBench und Tool-Use-Evaluierungen. DeepSeek-V4-Daten werden aktualisiert, sobald weitere Ergebnisse veröffentlicht werden.
Qwen 3.6 Plus hat starke Benchmark-Positionen bei Software-Engineering und agentischen Coding-Aufgaben etabliert, wobei das Open-Weight-Modell 27B nahezu Plus-Leistung liefert. Sobald DeepSeek V4 seinen Rollout abschließt, werden umfassendere Vergleiche verfügbar. Aktuelle Daten zeigen Qwen 3.6 an der Spitze der wichtigsten agentischen Benchmarks mit bewiesenen, reproduzierbaren Ergebnissen und einem ausgereiften Deployment-Ökosystem.


Qwen 3.6 Plus: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0
Qwen 3.6 27B: 77,2 % SWE-bench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus)
Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval
Beide Modelle: 1M-Token-Kontextfenster
Qwen 3.6 Plus: $0,40/$2,40 pro M Tokens, Batch mit 50 % Rabatt
Benchmark-Tabelle
Qwen 3.6 vs DeepSeek V4 - aktuelle Ergebnisse und Spezifikationen
Verfügbare Benchmark-Daten für beide Modellfamilien. DeepSeek-V4-Ergebnisse werden aktualisiert, sobald weitere Daten veröffentlicht werden. Qwen-3.6-Ergebnisse stammen aus offiziellen Veröffentlichungen mit reproduzierbaren Evaluierungen.
| Benchmark | Qwen 3.6 Plus Proprietär Jetzt verfügbar | Qwen 3.6 27B Dense Open-Weight | Qwen 3.6 35B A3B MoE Open-Weight | DeepSeek V4 ~1T MoE | DeepSeek V4 Pro 1,6T MoE |
|---|---|---|---|---|---|
SWE-bench Verified Reale Software-Engineering-Aufgaben | 78.8% | 77.2% | 73.4% | - | - |
Terminal-Bench 2.0 Terminal-Operationen | 61.6 | 59.3 | 51.5 | - | - |
SkillsBench Praktische Programmierfähigkeiten | - | 48.2 | - | - | - |
LiveCodeBench Wettbewerbsorientierte Code-Generierung | - | 83.9 | 80.4 | - | - |
Claw-Eval Avg End-to-End agentisches Programmieren | - | 72.4 | 68.7 | - | - |
Context window Maximale Kontextlänge | 1M tokens | 128K tokens | 128K tokens | 1M tokens | 1M tokens |
Architecture Modellarchitektur | Proprietary | 27B Dense | 35B MoE (3B active) | ~1T MoE | 1.6T MoE |
preserve_thinking Agentische Reasoning-Persistenz | Yes | No | No | No | No |
Open-weight Lokales Deployment verfügbar | No | Yes (Apache 2.0) | Yes (Apache 2.0) | TBD | TBD |
Qwen-3.6-Daten aus offizieller Veröffentlichung (März 2026). DeepSeek-V4-Daten aus ersten Launch-Berichten (April 2026). Einige DeepSeek-V4-Benchmarks stehen noch aus.
Qwen-Ökosystem
Bewiesene agentische Leistung, heute verfügbar, zu branchenführenden Preisen
Qwen 3.6 ist vollständig verfügbar mit bewiesenen Benchmarks, Open-Weight-Modellen unter Apache 2.0, preserve_thinking für agentische Workflows und Preisen ab $0,40/$2,40 pro Million Tokens. Nicht auf Benchmarks warten - heute loslegen.
Qwen 3.6 testen
Nicht auf Benchmarks warten - erleben Sie bewiesene agentische Leistung noch heute
Qwen 3.6 ist vollständig verfügbar mit 78,8 % SWE-bench, preserve_thinking und $0,40/$2,40 pro Million Tokens. Kostenlos chatten, lokal mit Open-Weight-Modellen deployen oder über die OpenAI-kompatible API integrieren. Funktioniert mit Claude Code, OpenClaw, Aider und Continue.dev.