Qwen 3.6 Modelle

Vier Modelle, eine Familie - vom Mac M4 16 GB bis zur Spitzenleistung für $0,40/M Tokens

Die Qwen-3.6-Familie umfasst proprietäre gehostete Modelle und Open-Weight-Veröffentlichungen. Plus liefert 78,8 % SWE-bench mit 1M Kontext und preserve_thinking zu $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6). Max bewältigt erweitertes Reasoning und multimodale Aufgaben. Das 27B-Dense-Modell erreicht 77,2 % SWE-bench und 48,2 SkillsBench (übertrifft Claude 4.5 Opus). Das 35B A3B MoE läuft auf Mac M4 16 GB bei Q3-Quantisierung mit 20-40 Tok/s. Jedes Modell teilt dieselbe Architektur-Grundlage und OpenAI-kompatible API.

Modellfamilie

Wählen Sie das richtige Qwen-3.6-Modell für Ihren Anwendungsfall und Ihr Budget

Von leichtgewichtigem lokalem Deployment auf dem Laptop bis zur maximalen gehosteten Leistung mit 1M Kontext deckt die Qwen-3.6-Familie jede Größenordnung, jedes Budget und jedes Deployment-Szenario ab.

Proprietär

Gehostete Modelle mit maximaler Leistung und 1M Kontext

Plus und Max sind proprietäre Modelle, die über API verfügbar sind. Sie bieten die höchste Leistung, 1M-Kontextfenster, bis zu 65.536 Ausgabe-Tokens und Features wie preserve_thinking, die exklusiv der gehosteten Stufe vorbehalten sind. DashScope-Preise starten bei $0,40 pro Million Input-Tokens - etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung zu 50 % des Echtzeit-Preises verfügbar.

Verfügbar über OpenAI-kompatible API via DashScope und OpenRouter (kostenlose Stufe verfügbar)

Open-Weight

Auf eigener Hardware betreiben mit voller Kontrolle - Apache 2.0 lizenziert

Die Modelle 27B Dense und 35B A3B MoE stehen unter der Apache 2.0-Lizenz. Lokales Deployment mit Ollama, vLLM, llama.cpp, SGLang oder KTransformers. Das 27B passt in 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression. Das 35B A3B läuft auf Mac M4 16 GB bei Q3-Quantisierung. Null Token-Kosten, volle Datenprivatsphäre und Freiheit zur Feinabstimmung.

Verfügbar auf HuggingFace, Ollama und in GGUF-Repositories

Qwen 3.6 Plus

Proprietär

Flaggschiff-Modell mit 1M Kontext, preserve_thinking für agentische Workflows und Spitzenleistung. 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. DashScope-Preise: $0,40 Input / $2,40 Output pro Million Tokens, etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung mit 50 % Rabatt. Bis zu 65.536 Ausgabe-Tokens pro Anfrage.

1M-Kontextfenster, preserve_thinking-Parameter, 65K Ausgabe-Tokens, Batch mit 50 % Rabatt

API-Zugang über DashScope und OpenRouter (kostenlose Vorschau verfügbar)

Qwen 3.6 Max

Proprietär

Leistungsstarkes proprietäres Modell, optimiert für komplexes Reasoning, multimodale Aufgaben und Dokumentenverständnis. Stark bei Mathematik, Naturwissenschaften, visueller Analyse und Langdokument-Verarbeitung. Erweitertes Kontextfenster mit fortgeschrittenen Reasoning-Fähigkeiten für die anspruchsvollsten analytischen Aufgaben.

Erweiterter Kontext, multimodale Fähigkeiten, erweitertes Reasoning, Dokumentenverständnis

API-Zugang über DashScope und OpenRouter

Qwen 3.6 27B

Open-Weight

Dense-Modell mit 27B Parametern und der besten Open-Weight-Coding-Leistung. 77,2 % SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus mit 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Läuft auf 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression bei 100K Kontext.

55,6 GB FP16, 16 GB VRAM mit IQ4_XS + KV-Cache-Kompression, Dense-Architektur, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), GGUF-Downloads

Qwen 3.6 35B A3B

Open-Weight

MoE-Modell mit 35B Gesamt- / 3B aktiven Parametern. Nahezu 27B-Leistung im Consumer-GPU-Format. 73,4 % SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Läuft auf Mac M4 16 GB bei Q3-Quantisierung (~17 GB). 20-40 Tok/s auf Consumer-Hardware bei 4-Bit. Vision und Multimodal unterstützt.

~21 GB Q4_K_M, ~17 GB Q3_K_M (Mac M4 16 GB), 3B aktive Parameter, 20-40 Tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), GGUF-Downloads

Qwen-Ökosystem

Eine einheitliche Modellfamilie für jedes Deployment-Szenario und Budget

Von der Cloud-API zu $0,40/M Tokens bis zum Mac M4-Laptop-Deployment bietet die Qwen-3.6-Familie konsistente Qualität, kompatible Schnittstellen und branchenführendes Preis-Leistungs-Verhältnis über alle Deployment-Ziele hinweg.

Qwen 3.6 Plus

78,8 % SWE-bench, 1M Kontext, $0,40/M Tokens

Plus testen

Qwen 3.6 Max

Erweitertes Reasoning und Multimodal

Max testen

Qwen 3.6 27B

77,2 % SWE-bench, übertrifft Claude bei SkillsBench

27B testen

Qwen 3.6 35B A3B

73,4 % SWE-bench, Mac M4 16 GB geeignet

35B testen

API-Referenz

OpenAI-kompatible Endpunkte, preserve_thinking

API ansehen

Community

Treten Sie der Qwen-Entwickler-Community bei

Beitreten

Loslegen

Bereit, die Qwen-3.6-Familie zu entdecken? Kostenlos testen, überall deployen

Testen Sie jedes Qwen-3.6-Modell kostenlos im Browser oder über OpenRouters kostenlose Stufe. Laden Sie Open-Weight-Modelle unter Apache 2.0 herunter und betreiben Sie sie auf eigener Hardware. Vom Mac M4 16 GB bis zum Produktionsserver, von $0,40/M Tokens API bis zum kostenlosen lokalen Deployment.