Qwen 3.6 35B A3B

35 miljard parameters, 3 miljard actief - frontier MoE op consumentenhardware

Qwen 3.6 35B A3B is een Mixture-of-Experts model dat slechts 3B parameters per token activeert uit 256 experts. Met 73.4% op SWE-bench Verified, 92.7% op AIME 2026 en Apache 2.0-licentie brengt het frontier-klasse programmeer- en redeneervermogen naar consumenten-GPU's.

Modelvarianten

Open-weight MoE voor lokale en cloud-deployment

Qwen 3.6 35B A3B levert sterke prestaties met minimale actieve parameters. Kies de instruction-tuned variant voor chat en programmeren, of het basismodel voor fine-tuning.

Mixture-of-Experts architectuur

35B totale parameters, 3B actief per token, 256 experts

Qwen 3.6 35B A3B gebruikt een Hybrid Gated DeltaNet + Gated Attention + MoE-ontwerp met 256 experts, waarbij 8 experts plus 1 gedeelde expert per token worden gerouteerd. De 262K native context is uitbreidbaar tot 1M tokens en de Apache 2.0-licentie maakt onbeperkt commercieel gebruik mogelijk.

Met slechts 3B actieve parameters per token draait dit model efficiënt op consumenten-GPU's terwijl het prestaties levert die veel grotere dense modellen evenaren.

Instruction-tuned

35B A3B Instruct

Geoptimaliseerd voor conversationele AI, programmeren en agentische taken op consumentenhardware

Gefinetuned voor instructieopvolging en multi-turn dialoog met MoE-efficiëntie

Nu beschikbaar - Apache 2.0

Voorgetraind

35B A3B Base

Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen

Voorgetraind met 256-expert MoE-routing op diverse data

Nu beschikbaar - Apache 2.0

Mogelijkheden

256 experts, 3B actief - maximale efficiëntie ontmoet sterke prestaties

Qwen 3.6 35B A3B combineert een enorme expertpool met minimale actieve berekening om indrukwekkende programmeer-, redeneer- en agentische mogelijkheden te leveren op consumentenhardware.

Real-world software engineering

73.4% op SWE-bench Verified - echte GitHub-issues oplossen met slechts 3B actieve parameters per token. Concurrerend met modellen die 10x meer rekenkracht gebruiken bij inferentie.

Terminalbewerkingen

51.5 op Terminal-Bench 2.0 voor complexe meerstaps terminal-workflows. Verwerkt debugging, systeembeheer en build-pipelinetaken met sterke bekwaamheid.

Geavanceerde wiskunde

92.7% op AIME 2026 - bijna frontier-niveau wiskundig redeneren van een model dat op consumenten-GPU's draait. Stap-voor-stap denkmodus maakt transparante probleemoplossing mogelijk.

262K tot 1M context

262K native contextvenster uitbreidbaar tot 1M tokens. Analyseer hele codebases, lange documenten en complexe multi-turn gesprekken zonder afkapping.

Competitief programmeren

80.4 op LiveCodeBench v6 voor algoritmische probleemoplossing. Sterke codegeneratie, debugging en refactoring-mogelijkheden in meerdere programmeertalen.

Open-weight vrijheid

Apache 2.0-licentie maakt onbeperkt commercieel gebruik, fine-tuning en herdistributie mogelijk. Volledige transparantie in modelgewichten voor onderzoek en aanpassing.

Belangrijkste highlights

Frontier MoE-prestaties op consumentenhardware

Qwen 3.6 35B A3B behaalt sterke resultaten op programmeer-, redeneer- en agentische benchmarks terwijl het slechts 3B parameters per token activeert.

Topprestaties

  • SWE-bench Verified: 73.4% - real-world software engineering
  • Terminal-Bench 2.0: 51.5 - complexe terminalbewerkingen
  • AIME 2026: 92.7% - geavanceerde wiskunde
  • LiveCodeBench v6: 80.4 - competitief programmeren
  • Apache 2.0-licentie - volledig open-weight

Technische specificaties

  • 35B totale parameters, 3B actief per token
  • 256 experts: 8 gerouteerd + 1 gedeeld actief per token
  • Hybrid Gated DeltaNet + Gated Attention + MoE-architectuur
  • 262K native context, uitbreidbaar tot 1M tokens
  • Draait lokaal op consumenten-GPU's

Prestaties

Sterke MoE-prestaties bij 3B actieve inferentiekosten

Qwen 3.6 35B A3B scoort 73.4% op SWE-bench Verified en 92.7% op AIME 2026 terwijl het slechts 3B parameters per token activeert - frontier-klasse mogelijkheden op consumentenhardware.

Qwen 3.6 35B A3B toont aan dat sparse MoE-architecturen met 256 experts indrukwekkende resultaten kunnen leveren op software engineering, wiskunde en competitief programmeren tegen een fractie van de rekenkosten.

Qwen 3.6 35B A3B prestatievergelijkingsgrafiek over programmeer- en redeneerbenchmarks

SWE-bench Verified: 73.4% met slechts 3B actieve parameters

Terminal-Bench 2.0: 51.5 voor terminalbewerkingen

AIME 2026: 92.7% op geavanceerde wiskunde

LiveCodeBench v6: 80.4 competitief programmeren

Apache 2.0 open-weight licentie

Benchmarkvergelijking

Qwen 3.6 35B A3B vs de Qwen 3.6 familie en concurrenten

Qwen 3.6 35B A3B levert sterke prestaties op software engineering, terminalbewerkingen en redeneerbenchmarks bij minimale inferentiekosten.

Benchmark
Qwen 3.6 35B A3B
MoE
Uitgelicht
Qwen 3.6 27B
Dense
Qwen 3.6 Plus
Eigen model
Qwen 3 235B A22B
MoE
SWE-bench Verified
Real-world software engineering
73.4%77.2%78.8%76.2%
Terminal-Bench 2.0
Terminalbewerkingen
51.559.361.6-
AIME 2026
Wiskunde
No tools
92.7%94.1%--
LiveCodeBench v6
Competitief programmeren
80.483.9--

Benchmarkresultaten van de officiële Qwen 3.6 modelkaart en HuggingFace-evaluaties.

256-Expert MoE

35B capaciteit, 3B inferentiekosten - draait op consumenten-GPU's

Het Mixture-of-Experts ontwerp routeert elke token door 8 van 256 experts plus 1 gedeelde expert. Alle 35B parameters worden geladen voor routeringsdiversiteit, maar slechts 3B worden geactiveerd per forward pass. Gecombineerd met de Hybrid Gated DeltaNet + Gated Attention-architectuur maakt dit consumenten-GPU deployment mogelijk met sterke prestaties.

  • 3B actieve parameters per token uit 35B totale capaciteit
  • 256 experts: 8 gerouteerd + 1 gedeeld actief per token
  • Draait lokaal op consumenten-GPU's met kwantisatie
35B capaciteit, 3B inferentiekosten - draait op consumenten-GPU's

Open Weight

Apache 2.0 - volledig open voor commercieel gebruik en fine-tuning

Qwen 3.6 35B A3B is uitgebracht onder de Apache 2.0-licentie, wat onbeperkte commerciële deployment, fine-tuning en herdistributie mogelijk maakt. Download gewichten van HuggingFace en deploy op je eigen infrastructuur met volledige controle.

  • Apache 2.0-licentie - geen gebruiksbeperkingen
  • Volledige gewichtstoegang voor fine-tuning en aanpassing
  • Community-gedreven ecosysteem met brede framework-ondersteuning

Qwen-ecosysteem

Onderdeel van de Qwen 3.6 modelfamilie

Qwen 3.6 35B A3B is de open-weight MoE-variant in Alibaba's nieuwste modelfamilie, ontworpen voor maximale toegankelijkheid op consumentenhardware.

Documentatie

Volledige gidsen voor integratie en deployment

Lees docs

HuggingFace

Download Apache 2.0-gewichten en verken de model hub

Downloaden

Modelkaart

Technische specificaties en evaluatieresultaten

Bekijk details

GitHub Repository

Broncode, voorbeelden en community-bijdragen

Bekijk code

API-toegang

OpenAI-compatibele API-endpoints voor cloud-deployment

Aan de slag

Community

Word lid van de Qwen-ontwikkelaarscommunity

Deelnemen

Aan de slag

Klaar om te bouwen met Qwen 3.6 35B A3B?

Begin direct gratis met chatten, of download open-weight modellen onder Apache 2.0 voor zelf-gehoste deployment op consumentenhardware.