Qwen 3.6 Modelle

Vier Modelle, eine Familie - vom Mac M4 16 GB bis zur Spitzenleistung für $0,40/M Tokens

Die Qwen-3.6-Familie umfasst proprietäre gehostete Modelle und Open-Weight-Veröffentlichungen. Plus liefert 78,8 % SWE-bench mit 1M Kontext und preserve_thinking zu $0,40/$2,40 pro Million Tokens (12x günstiger als Claude Opus 4.6). Max bewältigt erweitertes Reasoning und multimodale Aufgaben. Das 27B-Dense-Modell erreicht 77,2 % SWE-bench und 48,2 SkillsBench (übertrifft Claude 4.5 Opus). Das 35B A3B MoE läuft auf Mac M4 16 GB bei Q3-Quantisierung mit 20-40 Tok/s. Jedes Modell teilt dieselbe Architektur-Grundlage und OpenAI-kompatible API.

Chat starten Modelle vergleichen

Modellfamilie

Wählen Sie das richtige Qwen-3.6-Modell für Ihren Anwendungsfall und Ihr Budget

Von leichtgewichtigem lokalem Deployment auf dem Laptop bis zur maximalen gehosteten Leistung mit 1M Kontext deckt die Qwen-3.6-Familie jede Größenordnung, jedes Budget und jedes Deployment-Szenario ab.

Proprietär

Gehostete Modelle mit maximaler Leistung und 1M Kontext

Plus und Max sind proprietäre Modelle, die über API verfügbar sind. Sie bieten die höchste Leistung, 1M-Kontextfenster, bis zu 65.536 Ausgabe-Tokens und Features wie preserve_thinking, die exklusiv der gehosteten Stufe vorbehalten sind. DashScope-Preise starten bei $0,40 pro Million Input-Tokens - etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung zu 50 % des Echtzeit-Preises verfügbar.

Verfügbar über OpenAI-kompatible API via DashScope und OpenRouter (kostenlose Stufe verfügbar)

API-Preise ansehen

Open-Weight

Auf eigener Hardware betreiben mit voller Kontrolle - Apache 2.0 lizenziert

Die Modelle 27B Dense und 35B A3B MoE stehen unter der Apache 2.0-Lizenz. Lokales Deployment mit Ollama, vLLM, llama.cpp, SGLang oder KTransformers. Das 27B passt in 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression. Das 35B A3B läuft auf Mac M4 16 GB bei Q3-Quantisierung. Null Token-Kosten, volle Datenprivatsphäre und Freiheit zur Feinabstimmung.

Verfügbar auf HuggingFace, Ollama und in GGUF-Repositories

Qwen 3.6 Plus

Proprietär

Flaggschiff-Modell mit 1M Kontext, preserve_thinking für agentische Workflows und Spitzenleistung. 78,8 % SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. DashScope-Preise: $0,40 Input / $2,40 Output pro Million Tokens, etwa 12x günstiger als Claude Opus 4.6. Batch-Verarbeitung mit 50 % Rabatt. Bis zu 65.536 Ausgabe-Tokens pro Anfrage.

1M-Kontextfenster, preserve_thinking-Parameter, 65K Ausgabe-Tokens, Batch mit 50 % Rabatt

API-Zugang über DashScope und OpenRouter (kostenlose Vorschau verfügbar)

Plus testen API-Doku

Qwen 3.6 Max

Proprietär

Leistungsstarkes proprietäres Modell, optimiert für komplexes Reasoning, multimodale Aufgaben und Dokumentenverständnis. Stark bei Mathematik, Naturwissenschaften, visueller Analyse und Langdokument-Verarbeitung. Erweitertes Kontextfenster mit fortgeschrittenen Reasoning-Fähigkeiten für die anspruchsvollsten analytischen Aufgaben.

Erweiterter Kontext, multimodale Fähigkeiten, erweitertes Reasoning, Dokumentenverständnis

API-Zugang über DashScope und OpenRouter

Max testen API-Doku

Qwen 3.6 27B

Open-Weight

Dense-Modell mit 27B Parametern und der besten Open-Weight-Coding-Leistung. 77,2 % SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (übertrifft Claude 4.5 Opus mit 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Läuft auf 16 GB VRAM mit IQ4_XS GGUF und KV-Cache-Kompression bei 100K Kontext.

55,6 GB FP16, 16 GB VRAM mit IQ4_XS + KV-Cache-Kompression, Dense-Architektur, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), GGUF-Downloads

27B testen Herunterladen

Qwen 3.6 35B A3B

Open-Weight

MoE-Modell mit 35B Gesamt- / 3B aktiven Parametern. Nahezu 27B-Leistung im Consumer-GPU-Format. 73,4 % SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Läuft auf Mac M4 16 GB bei Q3-Quantisierung (~17 GB). 20-40 Tok/s auf Consumer-Hardware bei 4-Bit. Vision und Multimodal unterstützt.

~21 GB Q4_K_M, ~17 GB Q3_K_M (Mac M4 16 GB), 3B aktive Parameter, 20-40 Tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), GGUF-Downloads

35B A3B testen Herunterladen

Qwen-Ökosystem

Eine einheitliche Modellfamilie für jedes Deployment-Szenario und Budget

Von der Cloud-API zu $0,40/M Tokens bis zum Mac M4-Laptop-Deployment bietet die Qwen-3.6-Familie konsistente Qualität, kompatible Schnittstellen und branchenführendes Preis-Leistungs-Verhältnis über alle Deployment-Ziele hinweg.

Alle Modelle entdecken Offizielle Dokumentation

Qwen 3.6 Plus

78,8 % SWE-bench, 1M Kontext, $0,40/M Tokens

Plus testen

Qwen 3.6 Max

Erweitertes Reasoning und Multimodal

Max testen

Qwen 3.6 27B

77,2 % SWE-bench, übertrifft Claude bei SkillsBench

27B testen

Qwen 3.6 35B A3B

73,4 % SWE-bench, Mac M4 16 GB geeignet

35B testen

API-Referenz

OpenAI-kompatible Endpunkte, preserve_thinking

API ansehen

Community

Treten Sie der Qwen-Entwickler-Community bei

Beitreten

Loslegen

Bereit, die Qwen-3.6-Familie zu entdecken? Kostenlos testen, überall deployen

Testen Sie jedes Qwen-3.6-Modell kostenlos im Browser oder über OpenRouters kostenlose Stufe. Laden Sie Open-Weight-Modelle unter Apache 2.0 herunter und betreiben Sie sie auf eigener Hardware. Vom Mac M4 16 GB bis zum Produktionsserver, von $0,40/M Tokens API bis zum kostenlosen lokalen Deployment.

Chat starten Modelle vergleichen