Qwen 3.6 27B

27 Milliarden Parameter, dichte Architektur – übertrifft den 397B MoE-Vorgänger

Qwen 3.6 27B ist ein dichtes Modell auf Basis der Hybrid Gated DeltaNet-Architektur mit 64 Schichten und 262K nativem Kontext. Es erreicht 77,2 % auf SWE-bench Verified und übertrifft damit das 397B MoE Qwen 3 mit 76,2 % – bei nur ~55,6 GB VRAM in FP16 oder ~18 GB mit Quantisierung.

Jetzt chatten Benchmarks ansehen

Modellvarianten

Dichte Architektur, maximale Qualität pro Parameter

Qwen 3.6 27B liefert Spitzenleistung in einem dichten 27B-Formfaktor. Wähle die instruktionsoptimierte Variante für Chat und agentische Aufgaben oder das Basismodell zum Feintuning.

Hybrid Gated DeltaNet-Architektur

27B dichte Parameter, 64 Schichten, Hidden Dimension 5120

Qwen 3.6 27B nutzt ein Hybrid Gated DeltaNet-Design, das lineare Aufmerksamkeit mit Gated Recurrence kombiniert. Das 262K native Kontextfenster ist auf 1M Token erweiterbar – ideal für Langdokumentanalyse und komplexe agentische Workflows.

Mit einem VRAM-Bedarf von ~55,6 GB bei FP16 oder ~18 GB quantisiert läuft dieses Modell auf einer einzelnen High-End-GPU oder zwei Consumer-GPUs im qwen 3.6 27b gguf-Format.

Jetzt chatten Fähigkeiten ansehen

Instruktionsoptimiert

27B Instruct

Optimiert für konversationelle KI, Programmierung und komplexe agentische Aufgaben

Feinabgestimmt für Instruktionsbefolgung, Mehrrunden-Dialog und Tool-Nutzung über die qwen 3.6 27b api

Jetzt verfügbar

Jetzt chatten Gewichte herunterladen

Vortrainiert

27B Base

Dichtes Basismodell für Feintuning und spezialisierte Anwendungen

Vortrainiert auf vielfältigen Daten mit Hybrid Gated DeltaNet-Architektur für maximale Qualität

Jetzt verfügbar

Auf HuggingFace ansehen Feintuning-Anleitung

Fähigkeiten

Dichtes Kraftpaket, das über seiner Gewichtsklasse spielt

Qwen 3.6 27B kombiniert die Hybrid Gated DeltaNet-Architektur mit 262K Kontext und liefert Leistung, die Modelle mit 14-facher Größe bei realen Coding-Benchmarks übertrifft.

Elite-Softwareentwicklung

77,2 % auf SWE-bench Verified – besser als das 397B MoE Qwen 3 (76,2 %). Die Benchmark-Ergebnisse beweisen, dass dichte Architekturen mit Frontier-Modellen bei realer Programmierung mithalten können.

Terminal-Expertise

59,3 auf Terminal-Bench 2.0, gleichauf mit Claude 4.5 Opus. Bewältigt komplexe mehrstufige Terminal-Workflows, Debugging-Sitzungen und Systemadministrationsaufgaben auf Expertenniveau.

Fortgeschrittenes Reasoning

94,1 % auf AIME 2026 in Mathematik und 86,2 auf MMLU-Pro für Wissens-Reasoning. Der Schritt-für-Schritt-Denkmodus ermöglicht transparente Problemlösung in Mathematik, Logik und Naturwissenschaften.

262K bis 1M Kontext

262K natives Kontextfenster, erweiterbar auf 1M Token. Verarbeite ganze Codebasen, lange Forschungsarbeiten und Mehrrunden-Konversationen ohne Kohärenzverlust.

Wettbewerbsprogrammierung

83,9 auf LiveCodeBench v6 für Wettbewerbsprogrammierung. Hervorragend bei algorithmischer Problemlösung, Codegenerierung und komplexem Debugging.

Praktische Aufgabenausführung

48,2 auf SkillsBench – übertrifft Claude 4.5 Opus (45,3). Zeigt überlegene Fähigkeit, komplexe Anweisungen zu befolgen und mehrstufige reale Aufgaben auszuführen.

Wichtige Highlights

Herausragende Benchmark-Ergebnisse

Qwen 3.6 27B erzielt Spitzenergebnisse bei Coding-, Reasoning- und agentischen Benchmarks und behält dabei die Effizienz dichter Inferenz bei.

Top-Ergebnisse

SWE-bench Verified: 77,2 % – übertrifft den 397B MoE-Vorgänger (76,2 %)
Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus
SkillsBench: 48,2 – übertrifft Claude 4.5 Opus (45,3)
AIME 2026: 94,1 % Mathematik
LiveCodeBench v6: 83,9 Wettbewerbsprogrammierung

Technische Daten

27B dichte Parameter, 64 Schichten, Hidden Dimension 5120
Hybrid Gated DeltaNet-Architektur
262K nativer Kontext, erweiterbar auf 1M Token
qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB quantisiert
Verfügbar im qwen 3.6 27b gguf-Format für lokales Deployment

Kostenlos chatten Gewichte herunterladen

Leistung

Dichtes 27B-Modell übertrifft 397B MoE bei realer Programmierung

Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und 94,1 % auf AIME 2026 – der Beweis, dass ein gut konzipiertes dichtes Modell Modelle mit einem Vielfachen seiner Größe erreichen oder übertreffen kann.

Die Benchmark-Suite zeigt durchgehende Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Mathematik und Wettbewerbsprogrammierung – auf Augenhöhe mit oder besser als Modelle mit 10x+ mehr Parametern.

Jetzt chatten Modellkarte ansehen

Leistungsvergleichsdiagramm von Qwen 3.6 27B über Coding- und Reasoning-Benchmarks

SWE-bench Verified: 77,2 % – übertrifft 397B MoE Qwen 3 (76,2 %)

Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus

SkillsBench: 48,2 – übertrifft Claude 4.5 Opus mit 45,3

AIME 2026: 94,1 % bei fortgeschrittener Mathematik

MMLU-Pro: 86,2 über diverse Wissensdomänen

Benchmark-Vergleich

Qwen 3.6 27B vs. Frontier-Modelle

Qwen 3.6 27B liefert Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Reasoning und Coding-Benchmarks. Ergebnisse über die qwen 3.6 27b api abrufbar.

Benchmark	Qwen 3.6 27B Dicht Vorgestellt	Qwen 3 235B A22B MoE	Claude 4.5 Opus Proprietär	Qwen 3.6 35B A3B MoE
SWE-bench Verified Reale Softwareentwicklung	77.2%	76.2%	-	73.4%
Terminal-Bench 2.0 Terminal-Operationen	59.3	-	59.3	51.5
SkillsBench Reale Aufgabenausführung	48.2	-	45.3	-
AIME 2026 Mathematik Ohne Tools	94.1%	-	-	92.7%
LiveCodeBench v6 Wettbewerbsprogrammierung	83.9	-	-	80.4
MMLU-Pro Wissen & Reasoning	86.2	-	-	-

Benchmark-Ergebnisse aus der offiziellen Qwen 3.6 Modellkarte und HuggingFace-Evaluierungen.

Hybrid Gated DeltaNet

Eine neue Architektur, die die Effizienz dichter Modelle neu definiert

Die Hybrid Gated DeltaNet-Architektur kombiniert lineare Aufmerksamkeit mit Gated Recurrence über 64 Schichten und eine Hidden Dimension von 5120. Dieses Design ermöglicht 262K nativen Kontext, erweiterbar auf 1M Token, bei gleichzeitiger Einfachheit der Inferenz eines dichten Modells.

64 Schichten mit Hidden Dimension 5120 für tiefes Repräsentationslernen
262K natives Kontextfenster, erweiterbar auf 1M Token
qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB mit Quantisierung (qwen 3.6 27b gguf)

Jetzt chatten Architekturdetails ansehen

Eine neue Architektur, die die Effizienz dichter Modelle neu definiert

Softwareentwicklung

77,2 % SWE-bench Verified – das dichte Modell, das ein 397B MoE geschlagen hat

Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und übertrifft damit seinen 397B MoE-Vorgänger mit 76,2 %. Zusammen mit 59,3 auf Terminal-Bench 2.0 (gleichauf mit Claude 4.5 Opus) und 83,9 auf LiveCodeBench v6 ist es ein vollständiger Softwareentwicklungsassistent, zugänglich über die qwen 3.6 27b api.

77,2 % SWE-bench Verified – Lösung realer GitHub-Issues
59,3 Terminal-Bench 2.0 – Terminal-Operationen auf Expertenniveau
83,9 LiveCodeBench v6 – Spitzenleistung bei Wettbewerbsprogrammierung

Coding-Aufgaben testen Benchmarks ansehen

77,2 % SWE-bench Verified – das dichte Modell, das ein 397B MoE geschlagen hat

Erste Schritte

Qwen 3.6 27B jetzt ausprobieren

Starte sofort einen Chat über die qwen 3.6 27b api oder lade Gewichte für selbstgehostetes Deployment herunter.

Mit Qwen 3.6 27B chatten

Teste qwen3.6-27b sofort – kein Setup nötig

API-Dokumentation

Integration über die qwen 3.6 27b api mit OpenAI-kompatiblen Endpunkten

Modellkarte

Vollständige technische Spezifikationen und Benchmark-Ergebnisse

HuggingFace

Offizielles Modell-Repository mit Gewichten und Dokumentation

Lokales Deployment

Qwen 3.6 27B auf deiner Hardware betreiben

Lokales Deployment mit quantisierten qwen 3.6 27b gguf-Gewichten. Läuft auf Consumer-Hardware mit ~18 GB VRAM.

GGUF-Gewichte

qwen 3.6 27b gguf herunterladen für llama.cpp und Ollama

Ollama

Lokales Deployment mit einem Befehl

vLLM

Hochdurchsatz-Serving für Produktion

Qwen-Ökosystem

Teil der Qwen 3.6 Modellfamilie

Qwen 3.6 27B ist Teil von Alibabas neuester Modellfamilie mit dichten und MoE-Varianten, umfangreicher Community-Unterstützung und breiter Framework-Kompatibilität.

Qwen-Modelle entdecken Offizielle Seite