Qwen 3.6 27B vs 35B A3B

Dense-Power vs MoE-Effizienz - wählen Sie das Open-Weight-Modell, das zu Ihrer Hardware und Ihrem Workflow passt

Qwen 3.6 27B ist ein Dense-Modell mit allen 27B aktiven Parametern und liefert die beste Open-Weight-Coding-Leistung: 77,2 % SWE-bench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus mit 45,3), 83,9 LiveCodeBench. Es läuft auf 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression. Das 35B A3B nutzt Mixture-of-Experts mit nur 3B aktiven Parametern und erreicht 73,4 % SWE-bench bei Betrieb auf Mac M4 16 GB mit Q3-Quantisierung und 20-40 Tok/s auf Consumer-Hardware. Gleiche Familie, gleiche Apache 2.0-Lizenz, unterschiedliche Kompromisse.

Chat starten Benchmarks ansehen

Benchmarks

Qwen 3.6 27B vs 35B A3B - detaillierter Benchmark- und Hardware-Vergleich

Umfassende Benchmark-Ergebnisse zum Leistungsabstand zwischen Dense- und MoE-Variante bei Software-Engineering, Programmierung, Terminal-Operationen, mathematischem Denken, Frontend-Generierung und praktischen Programmierfähigkeiten.

Das 27B-Dense-Modell übertrifft die 35B A3B MoE-Variante durchgängig bei allen Benchmarks, aber der Abstand ist moderat und vorhersehbar. Das 35B A3B erreicht etwa 95 % der Qualität des 27B bei nur ~40 % der Rechenleistung und 2-3x höherer Geschwindigkeit. Das SkillsBench-Ergebnis des 27B von 48,2 (besser als Claude 4.5 Opus mit 45,3) unterstreicht seine Stärke im praktischen Engineering-Urteilsvermögen. Für Mac M4 16 GB-Nutzer ist das 35B A3B bei Q3 die klare Wahl. Für Workstation-Nutzer, die Qualität priorisieren, passt das 27B mit IQ4_XS in 16 GB VRAM.

Chat starten Modelle herunterladen

Benchmark-Vergleichsdiagramm mit Qwen 3.6 27B vs 35B A3B Leistung bei SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench, QwenWebBench und Claw-Eval

SWE-bench Verified: 77,2 % (27B) vs 73,4 % (35B A3B)

SkillsBench: 48,2 (27B) übertrifft Claude 4.5 Opus (45,3)

Terminal-Bench 2.0: 59,3 (27B) vs 51,5 (35B A3B)

35B A3B: 20-40 Tok/s auf Consumer-Hardware, Mac M4 16 GB bestätigt

27B IQ4_XS: passt in 16 GB VRAM mit KV-Cache-Kompression (100K Kontext)

Benchmark-Tabelle

27B Dense vs 35B A3B MoE - vollständige Ergebnisse mit Hardware-Spezifikationen

Direkter Benchmark-Vergleich mit Hardware-Anforderungen, Inferenzgeschwindigkeit und Effizienzmetriken für beide Open-Weight-Modelle.

Benchmark	Qwen 3.6 27B Dense (alle Parameter aktiv) Beste Qualität	Qwen 3.6 35B A3B MoE (3B aktiv) Beste Effizienz
SWE-bench Verified Reale Software-Engineering-Aufgaben	77.2%	73.4%
Terminal-Bench 2.0 Terminal-Operationen	59.3	51.5
SkillsBench Praktische Programmierfähigkeiten (Claude 4.5 Opus: 45,3)	48.2	-
AIME 2025 Mathematik-Wettbewerb	94.1%	92.7%
LiveCodeBench Wettbewerbsorientierte Code-Generierung	83.9	80.4
QwenWebBench Frontend-Code-Generierung	1487	1397
Claw-Eval Avg End-to-End agentisches Programmieren	72.4	68.7
NL2Repo Natürliche Sprache zu Repository	36.2	-
Model size (FP16) Modellgröße bei voller Präzision	55.6 GB	~70 GB total
Minimum VRAM (quantized) Kleinste funktionsfähige Konfiguration	16 GB (IQ4_XS + KV cache)	~17 GB (Q3_K_M)
Recommended VRAM Komfortabler Betrieb mit Kontext	24 GB (Q4_K_M)	24 GB (Q4_K_M)
Active parameters Berechnete Parameter pro Token	27B (all)	3B (of 35B)
Inference speed (4-bit) Consumer-Hardware Tok/s	~10-15 tok/s	20-40 tok/s
Mac M4 16GB Apple Silicon Laptop	IQ4_XS (tight)	Q3_K_M (confirmed)

Benchmark-Daten von HuggingFace-Modellkarten und der offiziellen Qwen-3.6-Veröffentlichung. Hardware-Benchmarks aus Unsloth-Community-Tests. SkillsBench-Referenz: Claude 4.5 Opus erreicht 45,3.

Qwen-Ökosystem

Zwei Open-Weight-Modelle für jedes Deployment-Szenario - Apache 2.0 lizenziert

Ob Sie maximale Qualität (27B, 77,2 % SWE-bench) oder Hardware-Effizienz (35B A3B, 20-40 Tok/s auf Consumer-GPU) priorisieren - die Qwen 3.6 Open-Weight-Familie hat das richtige Modell. Beide unter Apache 2.0 mit Vision-, Multimodal- und Tool-Calling-Unterstützung.

Alle Modelle entdecken HuggingFace-Sammlung

Qwen 3.6 27B

Dense, 77,2 % SWE-bench, 48,2 SkillsBench

Herunterladen

Qwen 3.6 35B A3B

MoE, 73,4 % SWE-bench, Mac M4 16 GB

Herunterladen

Ollama-Einrichtung

Lokales Deployment mit einem Befehl für beide Modelle

Loslegen

GGUF-Modelle

Quantisierte Modelle für jedes VRAM-Budget

Durchsuchen

vLLM-Serving

Produktions-Deployment mit Continuous Batching

Doku lesen

Community

Hilfe bei der Modellauswahl erhalten

Beitreten

Loslegen

Bereit, Ihr Qwen 3.6 Open-Weight-Modell zu wählen? Testen Sie beide kostenlos

Testen Sie beide Modelle im Browser und laden Sie dann das passende für Ihre Hardware herunter. 27B für maximale Qualität (77,2 % SWE-bench, übertrifft Claude bei SkillsBench), 35B A3B für Consumer-GPU-Deployment (20-40 Tok/s, Mac M4 16 GB bestätigt). Beide Apache 2.0 lizenziert.

Chat starten Modelle herunterladen