Qwen 3.6 27B vs 35B A3B

Puissance dense vs efficacité MoE — choisissez le modèle open-weight adapté à votre matériel et workflow

Qwen 3.6 27B est un modèle dense avec ses 27B paramètres tous actifs, offrant les meilleures performances open-weight en programmation : 77.2% SWE-bench, 48.2 SkillsBench (dépassant Claude 4.5 Opus à 45.3), 83.9 LiveCodeBench. Il tourne sur 16 Go VRAM avec IQ4_XS GGUF et compression du cache KV. Le 35B A3B utilise le Mixture-of-Experts avec seulement 3B paramètres actifs, atteignant 73.4% SWE-bench tout en tournant sur Mac M4 16 Go en quantification Q3 à 20-40 tok/s sur du matériel grand public. Même famille, même licence Apache 2.0, compromis différents.

Benchmarks

Qwen 3.6 27B vs 35B A3B — comparatif détaillé des benchmarks et du matériel

Résultats complets montrant l'écart de performance entre les variantes dense et MoE en ingénierie logicielle, programmation, opérations terminal, raisonnement mathématique, génération frontend et compétences pratiques.

Le modèle dense 27B surpasse systématiquement la variante MoE 35B A3B sur tous les benchmarks, mais l'écart est modéré et prévisible. Le 35B A3B atteint environ 95% de la qualité du 27B tout en ne nécessitant que ~40% du calcul et en tournant 2-3x plus vite. Le score SkillsBench du 27B de 48.2 (dépassant Claude 4.5 Opus à 45.3) souligne sa force en jugement d'ingénierie pratique. Pour les utilisateurs Mac M4 16 Go, le 35B A3B en Q3 est le choix évident. Pour les utilisateurs de stations de travail privilégiant la qualité, le 27B avec IQ4_XS tient dans 16 Go VRAM.

Graphique comparatif des performances Qwen 3.6 27B vs 35B A3B sur SWE-bench, Terminal-Bench, AIME, LiveCodeBench, SkillsBench, QwenWebBench et Claw-Eval

SWE-bench Verified : 77.2% (27B) vs 73.4% (35B A3B)

SkillsBench : 48.2 (27B) dépasse Claude 4.5 Opus (45.3)

Terminal-Bench 2.0 : 59.3 (27B) vs 51.5 (35B A3B)

35B A3B : 20-40 tok/s sur matériel grand public, Mac M4 16 Go confirmé

27B IQ4_XS : tient dans 16 Go VRAM avec compression du cache KV (100K de contexte)

Tableau des benchmarks

27B Dense vs 35B A3B MoE — résultats complets avec spécifications matérielles

Comparaison côte à côte des benchmarks avec configuration matérielle requise, vitesse d'inférence et métriques d'efficacité pour les deux modèles open-weight.

Benchmark
Qwen 3.6 27B
Dense (tous les paramètres actifs)
Meilleure qualité
Qwen 3.6 35B A3B
MoE (3B actifs)
Meilleure efficacité
SWE-bench Verified
Ingénierie logicielle réelle
77.2%73.4%
Terminal-Bench 2.0
Opérations terminal
59.351.5
SkillsBench
Compétences pratiques en programmation (Claude 4.5 Opus : 45.3)
48.2-
AIME 2025
Mathématiques de compétition
94.1%92.7%
LiveCodeBench
Génération de code compétitive
83.980.4
QwenWebBench
Génération de code frontend
14871397
Claw-Eval Avg
Codage agentique de bout en bout
72.468.7
NL2Repo
Langage naturel vers dépôt
36.2-
Model size (FP16)
Taille des poids en pleine précision
55.6 Go~70 Go au total
Minimum VRAM (quantized)
Configuration minimale fonctionnelle
16 Go (IQ4_XS + cache KV)~17 Go (Q3_K_M)
Recommended VRAM
Fonctionnement confortable avec contexte
24 Go (Q4_K_M)24 Go (Q4_K_M)
Active parameters
Paramètres calculés par token
27B (tous)3B (sur 35B)
Inference speed (4-bit)
tok/s matériel grand public
~10-15 tok/s20-40 tok/s
Mac M4 16GB
Ordinateur portable Apple Silicon
IQ4_XS (serré)Q3_K_M (confirmé)

Données de benchmark issues des fiches modèles HuggingFace et de la publication officielle Qwen 3.6. Benchmarks matériels issus des tests de la communauté Unsloth. Référence SkillsBench : Claude 4.5 Opus obtient 45.3.

Écosystème Qwen

Deux modèles open-weight pour chaque scénario de déploiement — sous licence Apache 2.0

Que vous privilégiez la qualité maximale (27B, 77.2% SWE-bench) ou l'efficacité matérielle (35B A3B, 20-40 tok/s sur GPU grand public), la famille open-weight Qwen 3.6 a le bon modèle. Les deux sous Apache 2.0 avec support vision, multimodal et appel d'outils.

Qwen 3.6 27B

Dense, 77.2% SWE-bench, 48.2 SkillsBench

Télécharger

Qwen 3.6 35B A3B

MoE, 73.4% SWE-bench, Mac M4 16 Go

Télécharger

Installation Ollama

Déploiement local en une commande pour les deux modèles

Commencer

Modèles GGUF

Modèles quantifiés pour chaque budget VRAM

Parcourir

Serveur vLLM

Déploiement en production avec batching continu

Lire la doc

Communauté

Obtenez de l'aide pour choisir le bon modèle

Rejoindre

Commencer

Prêt à choisir votre modèle open-weight Qwen 3.6 ? Essayez les deux gratuitement

Essayez les deux modèles dans le navigateur, puis téléchargez celui qui correspond à votre matériel. 27B pour la qualité maximale (77.2% SWE-bench, dépasse Claude sur SkillsBench), 35B A3B pour le déploiement sur GPU grand public (20-40 tok/s, Mac M4 16 Go confirmé). Les deux sous licence Apache 2.0.