Qwen 3.6 27B
27 Milliarden Parameter, dichte Architektur – übertrifft den 397B MoE-Vorgänger
Qwen 3.6 27B ist ein dichtes Modell auf Basis der Hybrid Gated DeltaNet-Architektur mit 64 Schichten und 262K nativem Kontext. Es erreicht 77,2 % auf SWE-bench Verified und übertrifft damit das 397B MoE Qwen 3 mit 76,2 % – bei nur ~55,6 GB VRAM in FP16 oder ~18 GB mit Quantisierung.
Modellvarianten
Dichte Architektur, maximale Qualität pro Parameter
Qwen 3.6 27B liefert Spitzenleistung in einem dichten 27B-Formfaktor. Wähle die instruktionsoptimierte Variante für Chat und agentische Aufgaben oder das Basismodell zum Feintuning.
Hybrid Gated DeltaNet-Architektur
27B dichte Parameter, 64 Schichten, Hidden Dimension 5120
Qwen 3.6 27B nutzt ein Hybrid Gated DeltaNet-Design, das lineare Aufmerksamkeit mit Gated Recurrence kombiniert. Das 262K native Kontextfenster ist auf 1M Token erweiterbar – ideal für Langdokumentanalyse und komplexe agentische Workflows.
Mit einem VRAM-Bedarf von ~55,6 GB bei FP16 oder ~18 GB quantisiert läuft dieses Modell auf einer einzelnen High-End-GPU oder zwei Consumer-GPUs im qwen 3.6 27b gguf-Format.
Instruktionsoptimiert
27B Instruct
Optimiert für konversationelle KI, Programmierung und komplexe agentische Aufgaben
Feinabgestimmt für Instruktionsbefolgung, Mehrrunden-Dialog und Tool-Nutzung über die qwen 3.6 27b api
Vortrainiert
27B Base
Dichtes Basismodell für Feintuning und spezialisierte Anwendungen
Vortrainiert auf vielfältigen Daten mit Hybrid Gated DeltaNet-Architektur für maximale Qualität
Fähigkeiten
Dichtes Kraftpaket, das über seiner Gewichtsklasse spielt
Qwen 3.6 27B kombiniert die Hybrid Gated DeltaNet-Architektur mit 262K Kontext und liefert Leistung, die Modelle mit 14-facher Größe bei realen Coding-Benchmarks übertrifft.
Elite-Softwareentwicklung
77,2 % auf SWE-bench Verified – besser als das 397B MoE Qwen 3 (76,2 %). Die Benchmark-Ergebnisse beweisen, dass dichte Architekturen mit Frontier-Modellen bei realer Programmierung mithalten können.
Terminal-Expertise
59,3 auf Terminal-Bench 2.0, gleichauf mit Claude 4.5 Opus. Bewältigt komplexe mehrstufige Terminal-Workflows, Debugging-Sitzungen und Systemadministrationsaufgaben auf Expertenniveau.
Fortgeschrittenes Reasoning
94,1 % auf AIME 2026 in Mathematik und 86,2 auf MMLU-Pro für Wissens-Reasoning. Der Schritt-für-Schritt-Denkmodus ermöglicht transparente Problemlösung in Mathematik, Logik und Naturwissenschaften.
262K bis 1M Kontext
262K natives Kontextfenster, erweiterbar auf 1M Token. Verarbeite ganze Codebasen, lange Forschungsarbeiten und Mehrrunden-Konversationen ohne Kohärenzverlust.
Wettbewerbsprogrammierung
83,9 auf LiveCodeBench v6 für Wettbewerbsprogrammierung. Hervorragend bei algorithmischer Problemlösung, Codegenerierung und komplexem Debugging.
Praktische Aufgabenausführung
48,2 auf SkillsBench – übertrifft Claude 4.5 Opus (45,3). Zeigt überlegene Fähigkeit, komplexe Anweisungen zu befolgen und mehrstufige reale Aufgaben auszuführen.
Wichtige Highlights
Herausragende Benchmark-Ergebnisse
Qwen 3.6 27B erzielt Spitzenergebnisse bei Coding-, Reasoning- und agentischen Benchmarks und behält dabei die Effizienz dichter Inferenz bei.
Top-Ergebnisse
- SWE-bench Verified: 77,2 % – übertrifft den 397B MoE-Vorgänger (76,2 %)
- Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus
- SkillsBench: 48,2 – übertrifft Claude 4.5 Opus (45,3)
- AIME 2026: 94,1 % Mathematik
- LiveCodeBench v6: 83,9 Wettbewerbsprogrammierung
Technische Daten
- 27B dichte Parameter, 64 Schichten, Hidden Dimension 5120
- Hybrid Gated DeltaNet-Architektur
- 262K nativer Kontext, erweiterbar auf 1M Token
- qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB quantisiert
- Verfügbar im qwen 3.6 27b gguf-Format für lokales Deployment
Leistung
Dichtes 27B-Modell übertrifft 397B MoE bei realer Programmierung
Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und 94,1 % auf AIME 2026 – der Beweis, dass ein gut konzipiertes dichtes Modell Modelle mit einem Vielfachen seiner Größe erreichen oder übertreffen kann.
Die Benchmark-Suite zeigt durchgehende Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Mathematik und Wettbewerbsprogrammierung – auf Augenhöhe mit oder besser als Modelle mit 10x+ mehr Parametern.


SWE-bench Verified: 77,2 % – übertrifft 397B MoE Qwen 3 (76,2 %)
Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus
SkillsBench: 48,2 – übertrifft Claude 4.5 Opus mit 45,3
AIME 2026: 94,1 % bei fortgeschrittener Mathematik
MMLU-Pro: 86,2 über diverse Wissensdomänen
Benchmark-Vergleich
Qwen 3.6 27B vs. Frontier-Modelle
Qwen 3.6 27B liefert Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Reasoning und Coding-Benchmarks. Ergebnisse über die qwen 3.6 27b api abrufbar.
| Benchmark | Qwen 3.6 27B Dicht Vorgestellt | Qwen 3 235B A22B MoE | Claude 4.5 Opus Proprietär | Qwen 3.6 35B A3B MoE |
|---|---|---|---|---|
SWE-bench Verified Reale Softwareentwicklung | 77.2% | 76.2% | - | 73.4% |
Terminal-Bench 2.0 Terminal-Operationen | 59.3 | - | 59.3 | 51.5 |
SkillsBench Reale Aufgabenausführung | 48.2 | - | 45.3 | - |
AIME 2026 Mathematik Ohne Tools | 94.1% | - | - | 92.7% |
LiveCodeBench v6 Wettbewerbsprogrammierung | 83.9 | - | - | 80.4 |
MMLU-Pro Wissen & Reasoning | 86.2 | - | - | - |
Benchmark-Ergebnisse aus der offiziellen Qwen 3.6 Modellkarte und HuggingFace-Evaluierungen.
Hybrid Gated DeltaNet
Eine neue Architektur, die die Effizienz dichter Modelle neu definiert
Die Hybrid Gated DeltaNet-Architektur kombiniert lineare Aufmerksamkeit mit Gated Recurrence über 64 Schichten und eine Hidden Dimension von 5120. Dieses Design ermöglicht 262K nativen Kontext, erweiterbar auf 1M Token, bei gleichzeitiger Einfachheit der Inferenz eines dichten Modells.
- 64 Schichten mit Hidden Dimension 5120 für tiefes Repräsentationslernen
- 262K natives Kontextfenster, erweiterbar auf 1M Token
- qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB mit Quantisierung (qwen 3.6 27b gguf)

Softwareentwicklung
77,2 % SWE-bench Verified – das dichte Modell, das ein 397B MoE geschlagen hat
Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und übertrifft damit seinen 397B MoE-Vorgänger mit 76,2 %. Zusammen mit 59,3 auf Terminal-Bench 2.0 (gleichauf mit Claude 4.5 Opus) und 83,9 auf LiveCodeBench v6 ist es ein vollständiger Softwareentwicklungsassistent, zugänglich über die qwen 3.6 27b api.
- 77,2 % SWE-bench Verified – Lösung realer GitHub-Issues
- 59,3 Terminal-Bench 2.0 – Terminal-Operationen auf Expertenniveau
- 83,9 LiveCodeBench v6 – Spitzenleistung bei Wettbewerbsprogrammierung

Erste Schritte
Qwen 3.6 27B jetzt ausprobieren
Starte sofort einen Chat über die qwen 3.6 27b api oder lade Gewichte für selbstgehostetes Deployment herunter.
Teste qwen3.6-27b sofort – kein Setup nötig
Integration über die qwen 3.6 27b api mit OpenAI-kompatiblen Endpunkten
Vollständige technische Spezifikationen und Benchmark-Ergebnisse
Offizielles Modell-Repository mit Gewichten und Dokumentation
Lokales Deployment
Qwen 3.6 27B auf deiner Hardware betreiben
Lokales Deployment mit quantisierten qwen 3.6 27b gguf-Gewichten. Läuft auf Consumer-Hardware mit ~18 GB VRAM.
Qwen-Ökosystem
Teil der Qwen 3.6 Modellfamilie
Qwen 3.6 27B ist Teil von Alibabas neuester Modellfamilie mit dichten und MoE-Varianten, umfangreicher Community-Unterstützung und breiter Framework-Kompatibilität.
Erste Schritte
Bereit, mit Qwen 3.6 27B zu entwickeln?
Starte sofort einen kostenlosen Chat oder lade qwen3.6-27b-Gewichte für selbstgehostetes Deployment auf deiner Infrastruktur herunter.