Qwen 3.6 27B

27 Milliarden Parameter, dichte Architektur – übertrifft den 397B MoE-Vorgänger

Qwen 3.6 27B ist ein dichtes Modell auf Basis der Hybrid Gated DeltaNet-Architektur mit 64 Schichten und 262K nativem Kontext. Es erreicht 77,2 % auf SWE-bench Verified und übertrifft damit das 397B MoE Qwen 3 mit 76,2 % – bei nur ~55,6 GB VRAM in FP16 oder ~18 GB mit Quantisierung.

Modellvarianten

Dichte Architektur, maximale Qualität pro Parameter

Qwen 3.6 27B liefert Spitzenleistung in einem dichten 27B-Formfaktor. Wähle die instruktionsoptimierte Variante für Chat und agentische Aufgaben oder das Basismodell zum Feintuning.

Hybrid Gated DeltaNet-Architektur

27B dichte Parameter, 64 Schichten, Hidden Dimension 5120

Qwen 3.6 27B nutzt ein Hybrid Gated DeltaNet-Design, das lineare Aufmerksamkeit mit Gated Recurrence kombiniert. Das 262K native Kontextfenster ist auf 1M Token erweiterbar – ideal für Langdokumentanalyse und komplexe agentische Workflows.

Mit einem VRAM-Bedarf von ~55,6 GB bei FP16 oder ~18 GB quantisiert läuft dieses Modell auf einer einzelnen High-End-GPU oder zwei Consumer-GPUs im qwen 3.6 27b gguf-Format.

Instruktionsoptimiert

27B Instruct

Optimiert für konversationelle KI, Programmierung und komplexe agentische Aufgaben

Feinabgestimmt für Instruktionsbefolgung, Mehrrunden-Dialog und Tool-Nutzung über die qwen 3.6 27b api

Jetzt verfügbar

Vortrainiert

27B Base

Dichtes Basismodell für Feintuning und spezialisierte Anwendungen

Vortrainiert auf vielfältigen Daten mit Hybrid Gated DeltaNet-Architektur für maximale Qualität

Jetzt verfügbar

Fähigkeiten

Dichtes Kraftpaket, das über seiner Gewichtsklasse spielt

Qwen 3.6 27B kombiniert die Hybrid Gated DeltaNet-Architektur mit 262K Kontext und liefert Leistung, die Modelle mit 14-facher Größe bei realen Coding-Benchmarks übertrifft.

Elite-Softwareentwicklung

77,2 % auf SWE-bench Verified – besser als das 397B MoE Qwen 3 (76,2 %). Die Benchmark-Ergebnisse beweisen, dass dichte Architekturen mit Frontier-Modellen bei realer Programmierung mithalten können.

Terminal-Expertise

59,3 auf Terminal-Bench 2.0, gleichauf mit Claude 4.5 Opus. Bewältigt komplexe mehrstufige Terminal-Workflows, Debugging-Sitzungen und Systemadministrationsaufgaben auf Expertenniveau.

Fortgeschrittenes Reasoning

94,1 % auf AIME 2026 in Mathematik und 86,2 auf MMLU-Pro für Wissens-Reasoning. Der Schritt-für-Schritt-Denkmodus ermöglicht transparente Problemlösung in Mathematik, Logik und Naturwissenschaften.

262K bis 1M Kontext

262K natives Kontextfenster, erweiterbar auf 1M Token. Verarbeite ganze Codebasen, lange Forschungsarbeiten und Mehrrunden-Konversationen ohne Kohärenzverlust.

Wettbewerbsprogrammierung

83,9 auf LiveCodeBench v6 für Wettbewerbsprogrammierung. Hervorragend bei algorithmischer Problemlösung, Codegenerierung und komplexem Debugging.

Praktische Aufgabenausführung

48,2 auf SkillsBench – übertrifft Claude 4.5 Opus (45,3). Zeigt überlegene Fähigkeit, komplexe Anweisungen zu befolgen und mehrstufige reale Aufgaben auszuführen.

Wichtige Highlights

Herausragende Benchmark-Ergebnisse

Qwen 3.6 27B erzielt Spitzenergebnisse bei Coding-, Reasoning- und agentischen Benchmarks und behält dabei die Effizienz dichter Inferenz bei.

Top-Ergebnisse

  • SWE-bench Verified: 77,2 % – übertrifft den 397B MoE-Vorgänger (76,2 %)
  • Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus
  • SkillsBench: 48,2 – übertrifft Claude 4.5 Opus (45,3)
  • AIME 2026: 94,1 % Mathematik
  • LiveCodeBench v6: 83,9 Wettbewerbsprogrammierung

Technische Daten

  • 27B dichte Parameter, 64 Schichten, Hidden Dimension 5120
  • Hybrid Gated DeltaNet-Architektur
  • 262K nativer Kontext, erweiterbar auf 1M Token
  • qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB quantisiert
  • Verfügbar im qwen 3.6 27b gguf-Format für lokales Deployment

Leistung

Dichtes 27B-Modell übertrifft 397B MoE bei realer Programmierung

Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und 94,1 % auf AIME 2026 – der Beweis, dass ein gut konzipiertes dichtes Modell Modelle mit einem Vielfachen seiner Größe erreichen oder übertreffen kann.

Die Benchmark-Suite zeigt durchgehende Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Mathematik und Wettbewerbsprogrammierung – auf Augenhöhe mit oder besser als Modelle mit 10x+ mehr Parametern.

Leistungsvergleichsdiagramm von Qwen 3.6 27B über Coding- und Reasoning-Benchmarks

SWE-bench Verified: 77,2 % – übertrifft 397B MoE Qwen 3 (76,2 %)

Terminal-Bench 2.0: 59,3 – gleichauf mit Claude 4.5 Opus

SkillsBench: 48,2 – übertrifft Claude 4.5 Opus mit 45,3

AIME 2026: 94,1 % bei fortgeschrittener Mathematik

MMLU-Pro: 86,2 über diverse Wissensdomänen

Benchmark-Vergleich

Qwen 3.6 27B vs. Frontier-Modelle

Qwen 3.6 27B liefert Spitzenleistung bei Softwareentwicklung, Terminal-Operationen, Reasoning und Coding-Benchmarks. Ergebnisse über die qwen 3.6 27b api abrufbar.

Benchmark
Qwen 3.6 27B
Dicht
Vorgestellt
Qwen 3 235B A22B
MoE
Claude 4.5 Opus
Proprietär
Qwen 3.6 35B A3B
MoE
SWE-bench Verified
Reale Softwareentwicklung
77.2%76.2%-73.4%
Terminal-Bench 2.0
Terminal-Operationen
59.3-59.351.5
SkillsBench
Reale Aufgabenausführung
48.2-45.3-
AIME 2026
Mathematik
Ohne Tools
94.1%--92.7%
LiveCodeBench v6
Wettbewerbsprogrammierung
83.9--80.4
MMLU-Pro
Wissen & Reasoning
86.2---

Benchmark-Ergebnisse aus der offiziellen Qwen 3.6 Modellkarte und HuggingFace-Evaluierungen.

Hybrid Gated DeltaNet

Eine neue Architektur, die die Effizienz dichter Modelle neu definiert

Die Hybrid Gated DeltaNet-Architektur kombiniert lineare Aufmerksamkeit mit Gated Recurrence über 64 Schichten und eine Hidden Dimension von 5120. Dieses Design ermöglicht 262K nativen Kontext, erweiterbar auf 1M Token, bei gleichzeitiger Einfachheit der Inferenz eines dichten Modells.

  • 64 Schichten mit Hidden Dimension 5120 für tiefes Repräsentationslernen
  • 262K natives Kontextfenster, erweiterbar auf 1M Token
  • qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB mit Quantisierung (qwen 3.6 27b gguf)
Eine neue Architektur, die die Effizienz dichter Modelle neu definiert

Softwareentwicklung

77,2 % SWE-bench Verified – das dichte Modell, das ein 397B MoE geschlagen hat

Qwen 3.6 27B erreicht 77,2 % auf SWE-bench Verified und übertrifft damit seinen 397B MoE-Vorgänger mit 76,2 %. Zusammen mit 59,3 auf Terminal-Bench 2.0 (gleichauf mit Claude 4.5 Opus) und 83,9 auf LiveCodeBench v6 ist es ein vollständiger Softwareentwicklungsassistent, zugänglich über die qwen 3.6 27b api.

  • 77,2 % SWE-bench Verified – Lösung realer GitHub-Issues
  • 59,3 Terminal-Bench 2.0 – Terminal-Operationen auf Expertenniveau
  • 83,9 LiveCodeBench v6 – Spitzenleistung bei Wettbewerbsprogrammierung
77,2 % SWE-bench Verified – das dichte Modell, das ein 397B MoE geschlagen hat

Lokales Deployment

Qwen 3.6 27B auf deiner Hardware betreiben

Lokales Deployment mit quantisierten qwen 3.6 27b gguf-Gewichten. Läuft auf Consumer-Hardware mit ~18 GB VRAM.

Qwen-Ökosystem

Teil der Qwen 3.6 Modellfamilie

Qwen 3.6 27B ist Teil von Alibabas neuester Modellfamilie mit dichten und MoE-Varianten, umfangreicher Community-Unterstützung und breiter Framework-Kompatibilität.

Dokumentation

Vollständige Anleitungen für Integration und Deployment

Docs lesen

HuggingFace

Gewichte herunterladen und den Model Hub erkunden

Herunterladen

Modellkarte

Technische Spezifikationen und Evaluierungsergebnisse

Details ansehen

GitHub-Repository

Quellcode, Beispiele und Community-Beiträge

Code ansehen

API-Zugang

OpenAI-kompatible qwen 3.6 27b api-Endpunkte

Loslegen

Community

Tritt der Qwen-Entwickler-Community bei

Beitreten

Erste Schritte

Bereit, mit Qwen 3.6 27B zu entwickeln?

Starte sofort einen kostenlosen Chat oder lade qwen3.6-27b-Gewichte für selbstgehostetes Deployment auf deiner Infrastruktur herunter.