Qwen 3.6 Modelle
Vier Modelle, eine Familie - vom Mac M4 16 GB bis zur Spitzenleistung für $0,40/M Tokens
Die Qwen-3.6-Familie umfasst proprietäre gehostete Modelle und Open-Weight-Veröffentlichungen. Plus liefert 78,8 % SWE-bench mit 1M Kontext und preserve_thinking zu $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6). Max bewältigt erweitertes Reasoning und multimodale Aufgaben. Das 27B-Dense-Modell erreicht 77,2 % SWE-bench und 48,2 SkillsBench (übertrifft Claude 4.5 Opus). Das 35B A3B MoE läuft auf Mac M4 16 GB bei Q3-Quantisierung mit 20-40 Tok/s. Jedes Modell teilt dieselbe Architektur-Grundlage und OpenAI-kompatible API.
Modellfamilie
Wählen Sie das richtige Qwen-3.6-Modell für Ihren Anwendungsfall und Ihr Budget
Von leichtgewichtigem lokalem Deployment auf dem Laptop bis zur maximalen gehosteten Leistung mit 1M Kontext deckt die Qwen-3.6-Familie jede Größenordnung, jedes Budget und jedes Deployment-Szenario ab.
Proprietär
Gehostete Modelle mit maximaler Leistung und 1M Kontext
Plus und Max sind proprietäre Modelle, die über API verfügbar sind. Sie bieten die höchste Leistung, 1M-Kontextfenster, bis zu 65.536 Ausgabe-Tokens und Features wie preserve_thinking, die exklusiv der gehosteten Stufe vorbehalten sind. DashScope-Preise starten bei $0,40 pro Million Input-Tokens - etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung zu 50 % des Echtzeit-Preises verfügbar.
Verfügbar über OpenAI-kompatible API via DashScope und OpenRouter (kostenlose Stufe verfügbar)
Open-Weight
Auf eigener Hardware betreiben mit voller Kontrolle - Apache 2.0 lizenziert
Die Modelle 27B Dense und 35B A3B MoE stehen unter der Apache 2.0-Lizenz. Lokales Deployment mit Ollama, vLLM, llama.cpp, SGLang oder KTransformers. Das 27B passt in 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression. Das 35B A3B läuft auf Mac M4 16 GB bei Q3-Quantisierung. Null Token-Kosten, volle Datenprivatsphäre und Freiheit zur Feinabstimmung.
Verfügbar auf HuggingFace, Ollama und in GGUF-Repositories
Qwen 3.6 Plus
Proprietär
Flaggschiff-Modell mit 1M Kontext, preserve_thinking für agentische Workflows und Spitzenleistung. 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. DashScope-Preise: $0,40 Input / $2,40 Output pro Million Tokens, etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung mit 50 % Rabatt. Bis zu 65.536 Ausgabe-Tokens pro Anfrage.
1M-Kontextfenster, preserve_thinking-Parameter, 65K Ausgabe-Tokens, Batch mit 50 % Rabatt
Qwen 3.6 Max
Proprietär
Leistungsstarkes proprietäres Modell, optimiert für komplexes Reasoning, multimodale Aufgaben und Dokumentenverständnis. Stark bei Mathematik, Naturwissenschaften, visueller Analyse und Langdokument-Verarbeitung. Erweitertes Kontextfenster mit fortgeschrittenen Reasoning-Fähigkeiten für die anspruchsvollsten analytischen Aufgaben.
Erweiterter Kontext, multimodale Fähigkeiten, erweitertes Reasoning, Dokumentenverständnis
Qwen 3.6 27B
Open-Weight
Dense-Modell mit 27B Parametern und der besten Open-Weight-Coding-Leistung. 77,2 % SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus mit 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Läuft auf 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression bei 100K Kontext.
55,6 GB FP16, 16 GB VRAM mit IQ4_XS + KV-Cache-Kompression, Dense-Architektur, Apache 2.0
Qwen 3.6 35B A3B
Open-Weight
MoE-Modell mit 35B Gesamt- / 3B aktiven Parametern. Nahezu 27B-Leistung im Consumer-GPU-Format. 73,4 % SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Läuft auf Mac M4 16 GB bei Q3-Quantisierung (~17 GB). 20-40 Tok/s auf Consumer-Hardware bei 4-Bit. Vision und Multimodal unterstützt.
~21 GB Q4_K_M, ~17 GB Q3_K_M (Mac M4 16 GB), 3B aktive Parameter, 20-40 Tok/s, Apache 2.0
Qwen-Ökosystem
Eine einheitliche Modellfamilie für jedes Deployment-Szenario und Budget
Von der Cloud-API zu $0,40/M Tokens bis zum Mac M4-Laptop-Deployment bietet die Qwen-3.6-Familie konsistente Qualität, kompatible Schnittstellen und branchenführendes Preis-Leistungs-Verhältnis über alle Deployment-Ziele hinweg.
Loslegen
Bereit, die Qwen-3.6-Familie zu entdecken? Kostenlos testen, überall deployen
Testen Sie jedes Qwen-3.6-Modell kostenlos im Browser oder über OpenRouters kostenlose Stufe. Laden Sie Open-Weight-Modelle unter Apache 2.0 herunter und betreiben Sie sie auf eigener Hardware. Vom Mac M4 16 GB bis zum Produktionsserver, von $0,40/M Tokens API bis zum kostenlosen lokalen Deployment.