Qwen 3.6 35B A3B

35 miljard parameters, 3 miljard actief - frontier MoE op consumentenhardware

Qwen 3.6 35B A3B is een Mixture-of-Experts model dat slechts 3B parameters per token activeert uit 256 experts. Met 73.4% op SWE-bench Verified, 92.7% op AIME 2026 en Apache 2.0-licentie brengt het frontier-klasse programmeer- en redeneervermogen naar consumenten-GPU's.

Begin met chatten Bekijk benchmarks

Modelvarianten

Open-weight MoE voor lokale en cloud-deployment

Qwen 3.6 35B A3B levert sterke prestaties met minimale actieve parameters. Kies de instruction-tuned variant voor chat en programmeren, of het basismodel voor fine-tuning.

Mixture-of-Experts architectuur

35B totale parameters, 3B actief per token, 256 experts

Qwen 3.6 35B A3B gebruikt een Hybrid Gated DeltaNet + Gated Attention + MoE-ontwerp met 256 experts, waarbij 8 experts plus 1 gedeelde expert per token worden gerouteerd. De 262K native context is uitbreidbaar tot 1M tokens en de Apache 2.0-licentie maakt onbeperkt commercieel gebruik mogelijk.

Met slechts 3B actieve parameters per token draait dit model efficiënt op consumenten-GPU's terwijl het prestaties levert die veel grotere dense modellen evenaren.

Begin met chatten Bekijk mogelijkheden

Instruction-tuned

35B A3B Instruct

Geoptimaliseerd voor conversationele AI, programmeren en agentische taken op consumentenhardware

Gefinetuned voor instructieopvolging en multi-turn dialoog met MoE-efficiëntie

Nu beschikbaar - Apache 2.0

Begin met chatten Download gewichten

Voorgetraind

35B A3B Base

Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen

Voorgetraind met 256-expert MoE-routing op diverse data

Nu beschikbaar - Apache 2.0

Bekijk op HuggingFace Fine-tuning gids

Mogelijkheden

256 experts, 3B actief - maximale efficiëntie ontmoet sterke prestaties

Qwen 3.6 35B A3B combineert een enorme expertpool met minimale actieve berekening om indrukwekkende programmeer-, redeneer- en agentische mogelijkheden te leveren op consumentenhardware.

Real-world software engineering

73.4% op SWE-bench Verified - echte GitHub-issues oplossen met slechts 3B actieve parameters per token. Concurrerend met modellen die 10x meer rekenkracht gebruiken bij inferentie.

Terminalbewerkingen

51.5 op Terminal-Bench 2.0 voor complexe meerstaps terminal-workflows. Verwerkt debugging, systeembeheer en build-pipelinetaken met sterke bekwaamheid.

Geavanceerde wiskunde

92.7% op AIME 2026 - bijna frontier-niveau wiskundig redeneren van een model dat op consumenten-GPU's draait. Stap-voor-stap denkmodus maakt transparante probleemoplossing mogelijk.

262K tot 1M context

262K native contextvenster uitbreidbaar tot 1M tokens. Analyseer hele codebases, lange documenten en complexe multi-turn gesprekken zonder afkapping.

Competitief programmeren

80.4 op LiveCodeBench v6 voor algoritmische probleemoplossing. Sterke codegeneratie, debugging en refactoring-mogelijkheden in meerdere programmeertalen.

Open-weight vrijheid

Apache 2.0-licentie maakt onbeperkt commercieel gebruik, fine-tuning en herdistributie mogelijk. Volledige transparantie in modelgewichten voor onderzoek en aanpassing.

Belangrijkste highlights

Frontier MoE-prestaties op consumentenhardware

Qwen 3.6 35B A3B behaalt sterke resultaten op programmeer-, redeneer- en agentische benchmarks terwijl het slechts 3B parameters per token activeert.

Topprestaties

SWE-bench Verified: 73.4% - real-world software engineering
Terminal-Bench 2.0: 51.5 - complexe terminalbewerkingen
AIME 2026: 92.7% - geavanceerde wiskunde
LiveCodeBench v6: 80.4 - competitief programmeren
Apache 2.0-licentie - volledig open-weight

Technische specificaties

35B totale parameters, 3B actief per token
256 experts: 8 gerouteerd + 1 gedeeld actief per token
Hybrid Gated DeltaNet + Gated Attention + MoE-architectuur
262K native context, uitbreidbaar tot 1M tokens
Draait lokaal op consumenten-GPU's

Start gratis chat Download gewichten

Prestaties

Sterke MoE-prestaties bij 3B actieve inferentiekosten

Qwen 3.6 35B A3B scoort 73.4% op SWE-bench Verified en 92.7% op AIME 2026 terwijl het slechts 3B parameters per token activeert - frontier-klasse mogelijkheden op consumentenhardware.

Qwen 3.6 35B A3B toont aan dat sparse MoE-architecturen met 256 experts indrukwekkende resultaten kunnen leveren op software engineering, wiskunde en competitief programmeren tegen een fractie van de rekenkosten.

Begin met chatten Bekijk modelkaart

Qwen 3.6 35B A3B prestatievergelijkingsgrafiek over programmeer- en redeneerbenchmarks

SWE-bench Verified: 73.4% met slechts 3B actieve parameters

Terminal-Bench 2.0: 51.5 voor terminalbewerkingen

AIME 2026: 92.7% op geavanceerde wiskunde

LiveCodeBench v6: 80.4 competitief programmeren

Apache 2.0 open-weight licentie

Benchmarkvergelijking

Qwen 3.6 35B A3B vs de Qwen 3.6 familie en concurrenten

Qwen 3.6 35B A3B levert sterke prestaties op software engineering, terminalbewerkingen en redeneerbenchmarks bij minimale inferentiekosten.

Benchmark	Qwen 3.6 35B A3B MoE Uitgelicht	Qwen 3.6 27B Dense	Qwen 3.6 Plus Eigen model	Qwen 3 235B A22B MoE
SWE-bench Verified Real-world software engineering	73.4%	77.2%	78.8%	76.2%
Terminal-Bench 2.0 Terminalbewerkingen	51.5	59.3	61.6	-
AIME 2026 Wiskunde No tools	92.7%	94.1%	-	-
LiveCodeBench v6 Competitief programmeren	80.4	83.9	-	-

Benchmarkresultaten van de officiële Qwen 3.6 modelkaart en HuggingFace-evaluaties.

256-Expert MoE

35B capaciteit, 3B inferentiekosten - draait op consumenten-GPU's

Het Mixture-of-Experts ontwerp routeert elke token door 8 van 256 experts plus 1 gedeelde expert. Alle 35B parameters worden geladen voor routeringsdiversiteit, maar slechts 3B worden geactiveerd per forward pass. Gecombineerd met de Hybrid Gated DeltaNet + Gated Attention-architectuur maakt dit consumenten-GPU deployment mogelijk met sterke prestaties.

3B actieve parameters per token uit 35B totale capaciteit
256 experts: 8 gerouteerd + 1 gedeeld actief per token
Draait lokaal op consumenten-GPU's met kwantisatie

Begin met chatten Bekijk architectuurdetails

35B capaciteit, 3B inferentiekosten - draait op consumenten-GPU's

Open Weight

Apache 2.0 - volledig open voor commercieel gebruik en fine-tuning

Qwen 3.6 35B A3B is uitgebracht onder de Apache 2.0-licentie, wat onbeperkte commerciële deployment, fine-tuning en herdistributie mogelijk maakt. Download gewichten van HuggingFace en deploy op je eigen infrastructuur met volledige controle.