Qwen 3.6 Modellen

Vier modellen, één familie - van Mac M4 16GB tot frontierprestaties voor $0,40/M tokens

De Qwen 3.6-familie omvat proprietary hosted modellen en open-weight releases. Plus levert 78,8% SWE-bench met 1M context en preserve_thinking voor $0,40/$2,40 per miljoen tokens (12x goedkoper dan Claude Opus 4.6). Max verwerkt geavanceerd redeneren en multimodale taken. Het 27B dense model behaalt 77,2% SWE-bench en 48,2 SkillsBench (beter dan Claude 4.5 Opus). De 35B A3B MoE draait op Mac M4 16GB met Q3-kwantisatie met 20-40 tok/s. Elk model deelt dezelfde architectuurbasis en OpenAI-compatibele API.

Modelfamilie

Kies het juiste Qwen 3.6-model voor jouw use case en budget

Van lichtgewicht lokale deployment op een laptop tot maximale hosted prestaties met 1M context, de Qwen 3.6-familie dekt elke schaal, elk budget en elk deploymentscenario.

Proprietary

Hosted modellen met maximale prestaties en 1M context

Plus en Max zijn proprietary modellen beschikbaar via API. Ze bieden de hoogste prestaties, 1M contextvensters, tot 65.536 outputtokens en features zoals preserve_thinking die exclusief zijn voor de hosted tier. DashScope-prijzen beginnen bij $0,40 per miljoen inputtokens - ongeveer 12x goedkoper dan Claude Opus 4.6. Batch-aanroepen beschikbaar tegen 50% van de realtime prijs.

Beschikbaar via OpenAI-compatibele API via DashScope en OpenRouter (gratis tier beschikbaar)

Open-weight

Draai op je eigen hardware met volledige controle - Apache 2.0 gelicentieerd

De 27B dense en 35B A3B MoE-modellen zijn uitgebracht onder de Apache 2.0-licentie. Deploy lokaal met Ollama, vLLM, llama.cpp, SGLang of KTransformers. De 27B past in 16GB VRAM met IQ4_XS GGUF en KV-cachecompressie. De 35B A3B draait op Mac M4 16GB met Q3-kwantisatie. Nul kosten per token, volledige dataprivacy en vrijheid om te fine-tunen.

Beschikbaar op HuggingFace, Ollama en GGUF-repositories

Qwen 3.6 Plus

Proprietary

Vlaggenschip proprietary model met 1M context, preserve_thinking voor agentische workflows en topprestaties. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. DashScope-prijzen: $0,40 input / $2,40 output per miljoen tokens, ongeveer 12x goedkoper dan Claude Opus 4.6. Batch-aanroepen met 50% korting. Tot 65.536 outputtokens per verzoek.

1M contextvenster, preserve_thinking-parameter, 65K outputtokens, batch met 50% korting

API-toegang via DashScope en OpenRouter (gratis preview-tier beschikbaar)

Qwen 3.6 Max

Proprietary

Krachtig proprietary model geoptimaliseerd voor complex redeneren, multimodale taken en documentbegrip. Sterk in wiskunde, wetenschap, visuele analyse en verwerking van lange documenten. Uitgebreid contextvenster met geavanceerde redeneermogelijkheden voor de meest veeleisende analytische taken.

Uitgebreide context, multimodale mogelijkheden, geavanceerd redeneren, documentbegrip

API-toegang via DashScope en OpenRouter

Qwen 3.6 27B

Open-weight

Dense 27B-parametermodel dat de beste open-weight codeerprestaties levert. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (beter dan Claude 4.5 Opus met 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Kan draaien op 16GB VRAM met IQ4_XS GGUF en KV-cachecompressie met ondersteuning voor 100K context.

55,6GB FP16, 16GB VRAM met IQ4_XS + KV-cachecompressie, dense architectuur, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), GGUF-downloads

Qwen 3.6 35B A3B

Open-weight

MoE-model met 35B totaal / 3B actieve parameters. Bijna-27B prestaties in een consumer-GPU formaat. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Draait op Mac M4 16GB met Q3-kwantisatie (~17GB). 20-40 tok/s op consumerhardware bij 4-bit. Vision en multimodaal ondersteund.

~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B actieve parameters, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), GGUF-downloads

Qwen-ecosysteem

Een uniforme modelfamilie voor elk deploymentscenario en budget

Van cloud-API voor $0,40/M tokens tot Mac M4-laptopdeployment, de Qwen 3.6-familie biedt consistente kwaliteit, compatibele interfaces en toonaangevende prijs-prestatie over alle deploymentdoelen.

Qwen 3.6 Plus

78,8% SWE-bench, 1M context, $0,40/M tokens

Probeer Plus

Qwen 3.6 Max

Geavanceerd redeneren en multimodaal

Probeer Max

Qwen 3.6 27B

77,2% SWE-bench, verslaat Claude op SkillsBench

Probeer 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, geschikt voor Mac M4 16GB

Probeer 35B

API-referentie

OpenAI-compatibele endpoints, preserve_thinking

Bekijk API

Community

Word lid van de Qwen-ontwikkelaarscommunity

Word lid

Aan de slag

Klaar om de Qwen 3.6-familie te verkennen? Probeer gratis, deploy overal

Probeer elk Qwen 3.6-model gratis in de browser of via de gratis tier van OpenRouter. Download open-weight modellen onder Apache 2.0 om op je eigen hardware te draaien. Van Mac M4 16GB tot productieservers, van $0,40/M tokens API tot lokale deployment zonder kosten.