Qwen 3.6 vs DeepSeek V4

Qwen 3.6 Plus führt bei agentischen Benchmarks mit bewiesenen Ergebnissen, während DeepSeek V4 die Arena betritt

DeepSeek V4 mit seiner ~1T-Parameter-MoE-Architektur und 1M-Kontextfenster ist ein bedeutender neuer Herausforderer in der KI-Landschaft. Doch Qwen 3.6 Plus führt bereits mit bewiesenen Benchmarks: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0 und dem preserve_thinking-Parameter für agentische Workflows. Mit $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6) bietet Qwen 3.6 ein unübertroffenes Preis-Leistungs-Verhältnis. DeepSeek V4 Pro skaliert auf 1,6T Parameter. Qwen stellt zudem Open-Weight-Modelle bereit (27B mit 77,2 % SWE-bench, 35B A3B) für lokales Deployment.

Qwen 3.6 testen Benchmarks ansehen

Benchmarks

Qwen 3.6 vs DeepSeek V4 - verfügbare Benchmark-Daten und Spezifikationen

Benchmark-Vergleich basierend auf aktuell verfügbaren Daten. Qwen 3.6 Plus führt bei agentischen Coding-Benchmarks mit bewiesenen Ergebnissen bei SWE-bench, Terminal-Bench, SkillsBench und Tool-Use-Evaluierungen. DeepSeek-V4-Daten werden aktualisiert, sobald weitere Ergebnisse veröffentlicht werden.

Qwen 3.6 Plus hat starke Benchmark-Positionen bei Software-Engineering und agentischen Coding-Aufgaben etabliert, wobei das Open-Weight-Modell 27B nahezu Plus-Leistung liefert. Sobald DeepSeek V4 seinen Rollout abschließt, werden umfassendere Vergleiche verfügbar. Aktuelle Daten zeigen Qwen 3.6 an der Spitze der wichtigsten agentischen Benchmarks mit bewiesenen, reproduzierbaren Ergebnissen und einem ausgereiften Deployment-Ökosystem.

Qwen 3.6 testen API-Dokumentation

Benchmark-Vergleichsdiagramm mit Qwen 3.6 vs DeepSeek V4 Leistung bei verfügbaren Benchmarks einschließlich SWE-bench, Terminal-Bench und SkillsBench

Qwen 3.6 Plus: 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2 % SWE-bench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Beide Modelle: 1M-Token-Kontextfenster

Qwen 3.6 Plus: $0,40/$2,40 pro M Tokens, Batch mit 50 % Rabatt

Benchmark-Tabelle

Qwen 3.6 vs DeepSeek V4 - aktuelle Ergebnisse und Spezifikationen

Verfügbare Benchmark-Daten für beide Modellfamilien. DeepSeek-V4-Ergebnisse werden aktualisiert, sobald weitere Daten veröffentlicht werden. Qwen-3.6-Ergebnisse stammen aus offiziellen Veröffentlichungen mit reproduzierbaren Evaluierungen.

Benchmark	Qwen 3.6 Plus Proprietär Jetzt verfügbar	Qwen 3.6 27B Dense Open-Weight	Qwen 3.6 35B A3B MoE Open-Weight	DeepSeek V4 ~1T MoE	DeepSeek V4 Pro 1,6T MoE
SWE-bench Verified Reale Software-Engineering-Aufgaben	78.8%	77.2%	73.4%	-	-
Terminal-Bench 2.0 Terminal-Operationen	61.6	59.3	51.5	-	-
SkillsBench Praktische Programmierfähigkeiten	-	48.2	-	-	-
LiveCodeBench Wettbewerbsorientierte Code-Generierung	-	83.9	80.4	-	-
Claw-Eval Avg End-to-End agentisches Programmieren	-	72.4	68.7	-	-
Context window Maximale Kontextlänge	1M tokens	128K tokens	128K tokens	1M tokens	1M tokens
Architecture Modellarchitektur	Proprietary	27B Dense	35B MoE (3B active)	~1T MoE	1.6T MoE
preserve_thinking Agentische Reasoning-Persistenz	Yes	No	No	No	No
Open-weight Lokales Deployment verfügbar	No	Yes (Apache 2.0)	Yes (Apache 2.0)	TBD	TBD

Qwen-3.6-Daten aus offizieller Veröffentlichung (März 2026). DeepSeek-V4-Daten aus ersten Launch-Berichten (April 2026). Einige DeepSeek-V4-Benchmarks stehen noch aus.

Qwen-Ökosystem

Bewiesene agentische Leistung, heute verfügbar, zu branchenführenden Preisen

Qwen 3.6 ist vollständig verfügbar mit bewiesenen Benchmarks, Open-Weight-Modellen unter Apache 2.0, preserve_thinking für agentische Workflows und Preisen ab $0,40/$2,40 pro Million Tokens. Nicht auf Benchmarks warten - heute loslegen.

Qwen-Modelle entdecken Offizielle Dokumentation

Qwen 3.6 Plus

78,8 % SWE-bench, $0,40/M Tokens

Plus testen

Qwen 3.6 27B

77,2 % SWE-bench, Open-Weight, Apache 2.0

27B testen

Qwen 3.6 35B A3B

73,4 % SWE-bench, Consumer-GPU

35B testen

API-Zugang

OpenAI-kompatibel, preserve_thinking, kostenlose Stufe

API ansehen

Lokal betreiben

Ollama, vLLM, llama.cpp, SGLang

Loslegen

Community

Treten Sie der Qwen-Entwickler-Community bei

Beitreten

Qwen 3.6 testen

Nicht auf Benchmarks warten - erleben Sie bewiesene agentische Leistung noch heute

Qwen 3.6 ist vollständig verfügbar mit 78,8 % SWE-bench, preserve_thinking und $0,40/$2,40 pro Million Tokens. Kostenlos chatten, lokal mit Open-Weight-Modellen deployen oder über die OpenAI-kompatible API integrieren. Funktioniert mit Claude Code, OpenClaw, Aider und Continue.dev.

Chat starten API-Dokumentation