Qwen 3.6 vs DeepSeek V4

Qwen 3.6 Plus führt bei agentischen Benchmarks mit bewiesenen Ergebnissen, während DeepSeek V4 die Arena betritt

DeepSeek V4 mit seiner ~1T-Parameter-MoE-Architektur und 1M-Kontextfenster ist ein bedeutender neuer Herausforderer in der KI-Landschaft. Doch Qwen 3.6 Plus führt bereits mit bewiesenen Benchmarks: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0 und dem preserve_thinking-Parameter für agentische Workflows. Mit $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6) bietet Qwen 3.6 ein unübertroffenes Preis-Leistungs-Verhältnis. DeepSeek V4 Pro skaliert auf 1,6T Parameter. Qwen stellt zudem Open-Weight-Modelle bereit (27B mit 77,2 % SWE-bench, 35B A3B) für lokales Deployment.

Benchmarks

Qwen 3.6 vs DeepSeek V4 - verfügbare Benchmark-Daten und Spezifikationen

Benchmark-Vergleich basierend auf aktuell verfügbaren Daten. Qwen 3.6 Plus führt bei agentischen Coding-Benchmarks mit bewiesenen Ergebnissen bei SWE-bench, Terminal-Bench, SkillsBench und Tool-Use-Evaluierungen. DeepSeek-V4-Daten werden aktualisiert, sobald weitere Ergebnisse veröffentlicht werden.

Qwen 3.6 Plus hat starke Benchmark-Positionen bei Software-Engineering und agentischen Coding-Aufgaben etabliert, wobei das Open-Weight-Modell 27B nahezu Plus-Leistung liefert. Sobald DeepSeek V4 seinen Rollout abschließt, werden umfassendere Vergleiche verfügbar. Aktuelle Daten zeigen Qwen 3.6 an der Spitze der wichtigsten agentischen Benchmarks mit bewiesenen, reproduzierbaren Ergebnissen und einem ausgereiften Deployment-Ökosystem.

Benchmark-Vergleichsdiagramm mit Qwen 3.6 vs DeepSeek V4 Leistung bei verfügbaren Benchmarks einschließlich SWE-bench, Terminal-Bench und SkillsBench

Qwen 3.6 Plus: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2 % SWE-bench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Beide Modelle: 1M-Token-Kontextfenster

Qwen 3.6 Plus: $0,40/$2,40 pro M Tokens, Batch mit 50 % Rabatt

Benchmark-Tabelle

Qwen 3.6 vs DeepSeek V4 - aktuelle Ergebnisse und Spezifikationen

Verfügbare Benchmark-Daten für beide Modellfamilien. DeepSeek-V4-Ergebnisse werden aktualisiert, sobald weitere Daten veröffentlicht werden. Qwen-3.6-Ergebnisse stammen aus offiziellen Veröffentlichungen mit reproduzierbaren Evaluierungen.

Benchmark
Qwen 3.6 Plus
Proprietär
Jetzt verfügbar
Qwen 3.6 27B
Dense Open-Weight
Qwen 3.6 35B A3B
MoE Open-Weight
DeepSeek V4
~1T MoE
DeepSeek V4 Pro
1,6T MoE
SWE-bench Verified
Reale Software-Engineering-Aufgaben
78.8%77.2%73.4%--
Terminal-Bench 2.0
Terminal-Operationen
61.659.351.5--
SkillsBench
Praktische Programmierfähigkeiten
-48.2---
LiveCodeBench
Wettbewerbsorientierte Code-Generierung
-83.980.4--
Claw-Eval Avg
End-to-End agentisches Programmieren
-72.468.7--
Context window
Maximale Kontextlänge
1M tokens128K tokens128K tokens1M tokens1M tokens
Architecture
Modellarchitektur
Proprietary27B Dense35B MoE (3B active)~1T MoE1.6T MoE
preserve_thinking
Agentische Reasoning-Persistenz
YesNoNoNoNo
Open-weight
Lokales Deployment verfügbar
NoYes (Apache 2.0)Yes (Apache 2.0)TBDTBD

Qwen-3.6-Daten aus offizieller Veröffentlichung (März 2026). DeepSeek-V4-Daten aus ersten Launch-Berichten (April 2026). Einige DeepSeek-V4-Benchmarks stehen noch aus.

Qwen-Ökosystem

Bewiesene agentische Leistung, heute verfügbar, zu branchenführenden Preisen

Qwen 3.6 ist vollständig verfügbar mit bewiesenen Benchmarks, Open-Weight-Modellen unter Apache 2.0, preserve_thinking für agentische Workflows und Preisen ab $0,40/$2,40 pro Million Tokens. Nicht auf Benchmarks warten - heute loslegen.

Qwen 3.6 Plus

78,8 % SWE-bench, $0,40/M Tokens

Plus testen

Qwen 3.6 27B

77,2 % SWE-bench, Open-Weight, Apache 2.0

27B testen

Qwen 3.6 35B A3B

73,4 % SWE-bench, Consumer-GPU

35B testen

API-Zugang

OpenAI-kompatibel, preserve_thinking, kostenlose Stufe

API ansehen

Lokal betreiben

Ollama, vLLM, llama.cpp, SGLang

Loslegen

Community

Treten Sie der Qwen-Entwickler-Community bei

Beitreten

Qwen 3.6 testen

Nicht auf Benchmarks warten - erleben Sie bewiesene agentische Leistung noch heute

Qwen 3.6 ist vollständig verfügbar mit 78,8 % SWE-bench, preserve_thinking und $0,40/$2,40 pro Million Tokens. Kostenlos chatten, lokal mit Open-Weight-Modellen deployen oder über die OpenAI-kompatible API integrieren. Funktioniert mit Claude Code, OpenClaw, Aider und Continue.dev.