Qwen 3.6 35B A3B
35 miljard parameters, 3 miljard actief - frontier MoE op consumentenhardware
Qwen 3.6 35B A3B is een Mixture-of-Experts model dat slechts 3B parameters per token activeert uit 256 experts. Met 73.4% op SWE-bench Verified, 92.7% op AIME 2026 en Apache 2.0-licentie brengt het frontier-klasse programmeer- en redeneervermogen naar consumenten-GPU's.
Modelvarianten
Open-weight MoE voor lokale en cloud-deployment
Qwen 3.6 35B A3B levert sterke prestaties met minimale actieve parameters. Kies de instruction-tuned variant voor chat en programmeren, of het basismodel voor fine-tuning.
Mixture-of-Experts architectuur
35B totale parameters, 3B actief per token, 256 experts
Qwen 3.6 35B A3B gebruikt een Hybrid Gated DeltaNet + Gated Attention + MoE-ontwerp met 256 experts, waarbij 8 experts plus 1 gedeelde expert per token worden gerouteerd. De 262K native context is uitbreidbaar tot 1M tokens en de Apache 2.0-licentie maakt onbeperkt commercieel gebruik mogelijk.
Met slechts 3B actieve parameters per token draait dit model efficiënt op consumenten-GPU's terwijl het prestaties levert die veel grotere dense modellen evenaren.
Instruction-tuned
35B A3B Instruct
Geoptimaliseerd voor conversationele AI, programmeren en agentische taken op consumentenhardware
Gefinetuned voor instructieopvolging en multi-turn dialoog met MoE-efficiëntie
Voorgetraind
35B A3B Base
Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen
Voorgetraind met 256-expert MoE-routing op diverse data
Mogelijkheden
256 experts, 3B actief - maximale efficiëntie ontmoet sterke prestaties
Qwen 3.6 35B A3B combineert een enorme expertpool met minimale actieve berekening om indrukwekkende programmeer-, redeneer- en agentische mogelijkheden te leveren op consumentenhardware.
Real-world software engineering
73.4% op SWE-bench Verified - echte GitHub-issues oplossen met slechts 3B actieve parameters per token. Concurrerend met modellen die 10x meer rekenkracht gebruiken bij inferentie.
Terminalbewerkingen
51.5 op Terminal-Bench 2.0 voor complexe meerstaps terminal-workflows. Verwerkt debugging, systeembeheer en build-pipelinetaken met sterke bekwaamheid.
Geavanceerde wiskunde
92.7% op AIME 2026 - bijna frontier-niveau wiskundig redeneren van een model dat op consumenten-GPU's draait. Stap-voor-stap denkmodus maakt transparante probleemoplossing mogelijk.
262K tot 1M context
262K native contextvenster uitbreidbaar tot 1M tokens. Analyseer hele codebases, lange documenten en complexe multi-turn gesprekken zonder afkapping.
Competitief programmeren
80.4 op LiveCodeBench v6 voor algoritmische probleemoplossing. Sterke codegeneratie, debugging en refactoring-mogelijkheden in meerdere programmeertalen.
Open-weight vrijheid
Apache 2.0-licentie maakt onbeperkt commercieel gebruik, fine-tuning en herdistributie mogelijk. Volledige transparantie in modelgewichten voor onderzoek en aanpassing.
Belangrijkste highlights
Frontier MoE-prestaties op consumentenhardware
Qwen 3.6 35B A3B behaalt sterke resultaten op programmeer-, redeneer- en agentische benchmarks terwijl het slechts 3B parameters per token activeert.
Topprestaties
- SWE-bench Verified: 73.4% - real-world software engineering
- Terminal-Bench 2.0: 51.5 - complexe terminalbewerkingen
- AIME 2026: 92.7% - geavanceerde wiskunde
- LiveCodeBench v6: 80.4 - competitief programmeren
- Apache 2.0-licentie - volledig open-weight
Technische specificaties
- 35B totale parameters, 3B actief per token
- 256 experts: 8 gerouteerd + 1 gedeeld actief per token
- Hybrid Gated DeltaNet + Gated Attention + MoE-architectuur
- 262K native context, uitbreidbaar tot 1M tokens
- Draait lokaal op consumenten-GPU's
Prestaties
Sterke MoE-prestaties bij 3B actieve inferentiekosten
Qwen 3.6 35B A3B scoort 73.4% op SWE-bench Verified en 92.7% op AIME 2026 terwijl het slechts 3B parameters per token activeert - frontier-klasse mogelijkheden op consumentenhardware.
Qwen 3.6 35B A3B toont aan dat sparse MoE-architecturen met 256 experts indrukwekkende resultaten kunnen leveren op software engineering, wiskunde en competitief programmeren tegen een fractie van de rekenkosten.


SWE-bench Verified: 73.4% met slechts 3B actieve parameters
Terminal-Bench 2.0: 51.5 voor terminalbewerkingen
AIME 2026: 92.7% op geavanceerde wiskunde
LiveCodeBench v6: 80.4 competitief programmeren
Apache 2.0 open-weight licentie
Benchmarkvergelijking
Qwen 3.6 35B A3B vs de Qwen 3.6 familie en concurrenten
Qwen 3.6 35B A3B levert sterke prestaties op software engineering, terminalbewerkingen en redeneerbenchmarks bij minimale inferentiekosten.
| Benchmark | Qwen 3.6 35B A3B MoE Uitgelicht | Qwen 3.6 27B Dense | Qwen 3.6 Plus Eigen model | Qwen 3 235B A22B MoE |
|---|---|---|---|---|
SWE-bench Verified Real-world software engineering | 73.4% | 77.2% | 78.8% | 76.2% |
Terminal-Bench 2.0 Terminalbewerkingen | 51.5 | 59.3 | 61.6 | - |
AIME 2026 Wiskunde No tools | 92.7% | 94.1% | - | - |
LiveCodeBench v6 Competitief programmeren | 80.4 | 83.9 | - | - |
Benchmarkresultaten van de officiële Qwen 3.6 modelkaart en HuggingFace-evaluaties.
256-Expert MoE
35B capaciteit, 3B inferentiekosten - draait op consumenten-GPU's
Het Mixture-of-Experts ontwerp routeert elke token door 8 van 256 experts plus 1 gedeelde expert. Alle 35B parameters worden geladen voor routeringsdiversiteit, maar slechts 3B worden geactiveerd per forward pass. Gecombineerd met de Hybrid Gated DeltaNet + Gated Attention-architectuur maakt dit consumenten-GPU deployment mogelijk met sterke prestaties.
- 3B actieve parameters per token uit 35B totale capaciteit
- 256 experts: 8 gerouteerd + 1 gedeeld actief per token
- Draait lokaal op consumenten-GPU's met kwantisatie

Open Weight
Apache 2.0 - volledig open voor commercieel gebruik en fine-tuning
Qwen 3.6 35B A3B is uitgebracht onder de Apache 2.0-licentie, wat onbeperkte commerciële deployment, fine-tuning en herdistributie mogelijk maakt. Download gewichten van HuggingFace en deploy op je eigen infrastructuur met volledige controle.
- Apache 2.0-licentie - geen gebruiksbeperkingen
- Volledige gewichtstoegang voor fine-tuning en aanpassing
- Community-gedreven ecosysteem met brede framework-ondersteuning
Aan de slag
Probeer Qwen 3.6 35B A3B nu
Begin direct met chatten, of download open-weight modellen voor zelf-gehoste deployment.
Lokale deployment
Draai op je eigen hardware
Deploy lokaal op consumenten-GPU's met gekwantiseerde gewichten. Apache 2.0-licentie voor onbeperkt gebruik.
Qwen-ecosysteem
Onderdeel van de Qwen 3.6 modelfamilie
Qwen 3.6 35B A3B is de open-weight MoE-variant in Alibaba's nieuwste modelfamilie, ontworpen voor maximale toegankelijkheid op consumentenhardware.
Aan de slag
Klaar om te bouwen met Qwen 3.6 35B A3B?
Begin direct gratis met chatten, of download open-weight modellen onder Apache 2.0 voor zelf-gehoste deployment op consumentenhardware.