Qwen 3.6 Modellen
Vier modellen, één familie - van Mac M4 16GB tot frontierprestaties voor $0,40/M tokens
De Qwen 3.6-familie omvat proprietary hosted modellen en open-weight releases. Plus levert 78,8% SWE-bench met 1M context en preserve_thinking voor $0,40/$2,40 per miljoen tokens (12x goedkoper dan Claude Opus 4.6). Max verwerkt geavanceerd redeneren en multimodale taken. Het 27B dense model behaalt 77,2% SWE-bench en 48,2 SkillsBench (beter dan Claude 4.5 Opus). De 35B A3B MoE draait op Mac M4 16GB met Q3-kwantisatie met 20-40 tok/s. Elk model deelt dezelfde architectuurbasis en OpenAI-compatibele API.
Modelfamilie
Kies het juiste Qwen 3.6-model voor jouw use case en budget
Van lichtgewicht lokale deployment op een laptop tot maximale hosted prestaties met 1M context, de Qwen 3.6-familie dekt elke schaal, elk budget en elk deploymentscenario.
Proprietary
Hosted modellen met maximale prestaties en 1M context
Plus en Max zijn proprietary modellen beschikbaar via API. Ze bieden de hoogste prestaties, 1M contextvensters, tot 65.536 outputtokens en features zoals preserve_thinking die exclusief zijn voor de hosted tier. DashScope-prijzen beginnen bij $0,40 per miljoen inputtokens - ongeveer 12x goedkoper dan Claude Opus 4.6. Batch-aanroepen beschikbaar tegen 50% van de realtime prijs.
Beschikbaar via OpenAI-compatibele API via DashScope en OpenRouter (gratis tier beschikbaar)
Open-weight
Draai op je eigen hardware met volledige controle - Apache 2.0 gelicentieerd
De 27B dense en 35B A3B MoE-modellen zijn uitgebracht onder de Apache 2.0-licentie. Deploy lokaal met Ollama, vLLM, llama.cpp, SGLang of KTransformers. De 27B past in 16GB VRAM met IQ4_XS GGUF en KV-cachecompressie. De 35B A3B draait op Mac M4 16GB met Q3-kwantisatie. Nul kosten per token, volledige dataprivacy en vrijheid om te fine-tunen.
Beschikbaar op HuggingFace, Ollama en GGUF-repositories
Qwen 3.6 Plus
Proprietary
Vlaggenschip proprietary model met 1M context, preserve_thinking voor agentische workflows en topprestaties. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. DashScope-prijzen: $0,40 input / $2,40 output per miljoen tokens, ongeveer 12x goedkoper dan Claude Opus 4.6. Batch-aanroepen met 50% korting. Tot 65.536 outputtokens per verzoek.
1M contextvenster, preserve_thinking-parameter, 65K outputtokens, batch met 50% korting
Qwen 3.6 Max
Proprietary
Krachtig proprietary model geoptimaliseerd voor complex redeneren, multimodale taken en documentbegrip. Sterk in wiskunde, wetenschap, visuele analyse en verwerking van lange documenten. Uitgebreid contextvenster met geavanceerde redeneermogelijkheden voor de meest veeleisende analytische taken.
Uitgebreide context, multimodale mogelijkheden, geavanceerd redeneren, documentbegrip
Qwen 3.6 27B
Open-weight
Dense 27B-parametermodel dat de beste open-weight codeerprestaties levert. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (beter dan Claude 4.5 Opus met 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Kan draaien op 16GB VRAM met IQ4_XS GGUF en KV-cachecompressie met ondersteuning voor 100K context.
55,6GB FP16, 16GB VRAM met IQ4_XS + KV-cachecompressie, dense architectuur, Apache 2.0
Qwen 3.6 35B A3B
Open-weight
MoE-model met 35B totaal / 3B actieve parameters. Bijna-27B prestaties in een consumer-GPU formaat. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Draait op Mac M4 16GB met Q3-kwantisatie (~17GB). 20-40 tok/s op consumerhardware bij 4-bit. Vision en multimodaal ondersteund.
~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B actieve parameters, 20-40 tok/s, Apache 2.0
Qwen-ecosysteem
Een uniforme modelfamilie voor elk deploymentscenario en budget
Van cloud-API voor $0,40/M tokens tot Mac M4-laptopdeployment, de Qwen 3.6-familie biedt consistente kwaliteit, compatibele interfaces en toonaangevende prijs-prestatie over alle deploymentdoelen.
Aan de slag
Klaar om de Qwen 3.6-familie te verkennen? Probeer gratis, deploy overal
Probeer elk Qwen 3.6-model gratis in de browser of via de gratis tier van OpenRouter. Download open-weight modellen onder Apache 2.0 om op je eigen hardware te draaien. Van Mac M4 16GB tot productieservers, van $0,40/M tokens API tot lokale deployment zonder kosten.