Qwen 3.6 27B
27 milliards de paramètres, architecture dense - surpasse son prédécesseur MoE de 397B
Qwen 3.6 27B est un modèle dense basé sur l'architecture Hybrid Gated DeltaNet avec 64 couches et un contexte natif de 262K. Il atteint 77,2 % sur SWE-bench Verified, dépassant le Qwen 3 MoE 397B à 76,2 %, tout en tenant dans environ 55,6 Go de VRAM en FP16 ou environ 18 Go avec quantification.
Variantes du modèle
Architecture dense, qualité maximale par paramètre
Qwen 3.6 27B offre des performances de classe frontière dans un format dense de 27B. Choisissez la variante instruction-tuned pour le chat et les tâches agentiques, ou le modèle de base pour le fine-tuning.
Architecture Hybrid Gated DeltaNet
27B paramètres denses, 64 couches, dimension cachée 5120
Qwen 3.6 27B utilise une conception Hybrid Gated DeltaNet qui combine l'efficacité de l'attention linéaire avec la récurrence à portes. La fenêtre de contexte native de 262K est extensible à 1M de tokens, ce qui le rend idéal pour l'analyse de longs documents et les workflows agentiques complexes.
Avec des besoins en VRAM d'environ 55,6 Go en FP16 ou environ 18 Go quantifié, ce modèle fonctionne sur un seul GPU haut de gamme ou deux GPU grand public au format qwen 3.6 27b gguf.
Instruction-tuned
27B Instruct
Optimisé pour l'IA conversationnelle, le codage et les tâches agentiques complexes
Fine-tuné pour le suivi d'instructions, le dialogue multi-tours et l'utilisation d'outils via l'API qwen 3.6 27b
Pré-entraîné
27B Base
Modèle dense de base pour le fine-tuning et les applications spécialisées
Pré-entraîné sur des données diversifiées avec l'architecture Hybrid Gated DeltaNet pour une qualité maximale
Capacités
Un modèle dense qui surpasse sa catégorie
Qwen 3.6 27B combine l'architecture Hybrid Gated DeltaNet avec un contexte de 262K pour offrir des performances qui surpassent des modèles 14 fois plus grands sur les benchmarks de codage réels.
Ingénierie logicielle d'élite
77,2 % sur SWE-bench Verified - dépassant le Qwen 3 MoE 397B (76,2 %). Les résultats du benchmark qwen 3.6 27b prouvent que les architectures denses peuvent égaler les modèles de classe frontière sur le codage réel.
Maîtrise du terminal
59,3 sur Terminal-Bench 2.0, égalant Claude 4.5 Opus. Gère les workflows terminaux complexes multi-étapes, les sessions de débogage et les tâches d'administration système avec une compétence de niveau expert.
Raisonnement avancé
94,1 % sur AIME 2026 en mathématiques et 86,2 sur MMLU-Pro en raisonnement. Le mode de réflexion étape par étape permet une résolution de problèmes transparente en mathématiques, logique et sciences.
Contexte de 262K à 1M
Fenêtre de contexte native de 262K extensible à 1M de tokens. Traitez des bases de code entières, de longs articles de recherche et des conversations multi-tours sans perte de cohérence.
Programmation compétitive
83,9 sur LiveCodeBench v6 pour la programmation compétitive. Excelle dans la résolution de problèmes algorithmiques, la génération de code et les tâches de débogage complexes.
Exécution de compétences pratiques
48,2 sur SkillsBench, surpassant Claude 4.5 Opus (45,3). Démontre une capacité supérieure à suivre des instructions complexes et à exécuter des tâches réelles multi-étapes.
Points clés
Résultats exceptionnels du benchmark qwen 3.6 27b
Qwen 3.6 27B atteint des résultats de classe frontière en codage, raisonnement et benchmarks agentiques tout en maintenant une inférence dense efficace.
Principales réalisations
- SWE-bench Verified : 77,2 % - surpasse le prédécesseur MoE 397B (76,2 %)
- Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus
- SkillsBench : 48,2 - surpasse Claude 4.5 Opus (45,3)
- AIME 2026 : 94,1 % en mathématiques
- LiveCodeBench v6 : 83,9 en programmation compétitive
Spécifications techniques
- 27B paramètres denses, 64 couches, dimension cachée 5120
- Architecture Hybrid Gated DeltaNet
- Contexte natif de 262K, extensible à 1M de tokens
- qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go quantifié
- Disponible au format qwen 3.6 27b gguf pour le déploiement local
Performance
Un modèle dense de 27B qui surpasse un MoE de 397B en codage réel
Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified et 94,1 % sur AIME 2026, prouvant qu'un modèle dense bien architecturé peut égaler ou surpasser des modèles bien plus grands.
La suite de benchmarks qwen 3.6 27b démontre une excellence constante en ingénierie logicielle, opérations terminales, mathématiques et programmation compétitive - rivalisant ou surpassant des modèles avec plus de 10 fois plus de paramètres.


SWE-bench Verified : 77,2 % - surpasse le Qwen 3 MoE 397B (76,2 %)
Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus
SkillsBench : 48,2 - surpasse Claude 4.5 Opus à 45,3
AIME 2026 : 94,1 % en mathématiques avancées
MMLU-Pro : 86,2 dans divers domaines de connaissances
Comparaison des benchmarks
Qwen 3.6 27B vs modèles de pointe
Qwen 3.6 27B offre des performances de classe frontière en ingénierie logicielle, opérations terminales, raisonnement et benchmarks de codage. Accédez aux résultats via l'API qwen 3.6 27b.
| Benchmark | Qwen 3.6 27B Dense En vedette | Qwen 3 235B A22B MoE | Claude 4.5 Opus Propriétaire | Qwen 3.6 35B A3B MoE |
|---|---|---|---|---|
SWE-bench Verified Ingénierie logicielle réelle | 77.2% | 76.2% | - | 73.4% |
Terminal-Bench 2.0 Opérations terminales | 59.3 | - | 59.3 | 51.5 |
SkillsBench Exécution de tâches réelles | 48.2 | - | 45.3 | - |
AIME 2026 Mathématiques No tools | 94.1% | - | - | 92.7% |
LiveCodeBench v6 Programmation compétitive | 83.9 | - | - | 80.4 |
MMLU-Pro Connaissances et raisonnement | 86.2 | - | - | - |
Résultats des benchmarks issus de la fiche officielle du modèle Qwen 3.6 et des évaluations HuggingFace.
Hybrid Gated DeltaNet
Une nouvelle architecture qui redéfinit l'efficacité des modèles denses
L'architecture Hybrid Gated DeltaNet combine l'attention linéaire avec la récurrence à portes sur 64 couches et une dimension cachée de 5120. Cette conception permet un contexte natif de 262K extensible à 1M de tokens tout en maintenant la simplicité d'inférence d'un modèle dense.
- 64 couches avec dimension cachée 5120 pour un apprentissage de représentation profond
- Fenêtre de contexte native de 262K, extensible à 1M de tokens
- qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go avec quantification (qwen 3.6 27b gguf)

Ingénierie logicielle
77,2 % SWE-bench Verified - le modèle dense qui a battu un MoE de 397B
Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified, surpassant son prédécesseur MoE 397B à 76,2 %. Combiné avec 59,3 sur Terminal-Bench 2.0 (égalant Claude 4.5 Opus) et 83,9 sur LiveCodeBench v6, c'est un assistant complet en ingénierie logicielle accessible via l'API qwen 3.6 27b.
- 77,2 % SWE-bench Verified - résolution de problèmes GitHub réels
- 59,3 Terminal-Bench 2.0 - opérations terminales de niveau expert
- 83,9 LiveCodeBench v6 - excellence en programmation compétitive

Pour commencer
Essayez Qwen 3.6 27B maintenant
Commencez à discuter instantanément via l'API qwen 3.6 27b, ou téléchargez les poids pour un déploiement auto-hébergé.
Essayez qwen3.6-27b instantanément - aucune configuration requise
Intégration via l'API qwen 3.6 27b avec des endpoints compatibles OpenAI
Spécifications techniques complètes et résultats du benchmark qwen 3.6 27b
Dépôt officiel du modèle avec poids et documentation
Déploiement local
Exécutez Qwen 3.6 27B sur votre matériel
Déployez localement avec les poids quantifiés qwen 3.6 27b gguf. Fonctionne sur du matériel grand public avec environ 18 Go de VRAM.
Écosystème Qwen
Membre de la famille de modèles Qwen 3.6
Qwen 3.6 27B fait partie de la dernière famille de modèles d'Alibaba, avec des variantes denses et MoE, un support communautaire étendu et une large compatibilité avec les frameworks.
Pour commencer
Prêt à construire avec Qwen 3.6 27B ?
Commencez à discuter gratuitement instantanément, ou téléchargez les poids qwen3.6-27b pour un déploiement auto-hébergé sur votre infrastructure.