Qwen 3.6 27B

27 milliards de paramètres, architecture dense - surpasse son prédécesseur MoE de 397B

Qwen 3.6 27B est un modèle dense basé sur l'architecture Hybrid Gated DeltaNet avec 64 couches et un contexte natif de 262K. Il atteint 77,2 % sur SWE-bench Verified, dépassant le Qwen 3 MoE 397B à 76,2 %, tout en tenant dans environ 55,6 Go de VRAM en FP16 ou environ 18 Go avec quantification.

Variantes du modèle

Architecture dense, qualité maximale par paramètre

Qwen 3.6 27B offre des performances de classe frontière dans un format dense de 27B. Choisissez la variante instruction-tuned pour le chat et les tâches agentiques, ou le modèle de base pour le fine-tuning.

Architecture Hybrid Gated DeltaNet

27B paramètres denses, 64 couches, dimension cachée 5120

Qwen 3.6 27B utilise une conception Hybrid Gated DeltaNet qui combine l'efficacité de l'attention linéaire avec la récurrence à portes. La fenêtre de contexte native de 262K est extensible à 1M de tokens, ce qui le rend idéal pour l'analyse de longs documents et les workflows agentiques complexes.

Avec des besoins en VRAM d'environ 55,6 Go en FP16 ou environ 18 Go quantifié, ce modèle fonctionne sur un seul GPU haut de gamme ou deux GPU grand public au format qwen 3.6 27b gguf.

Instruction-tuned

27B Instruct

Optimisé pour l'IA conversationnelle, le codage et les tâches agentiques complexes

Fine-tuné pour le suivi d'instructions, le dialogue multi-tours et l'utilisation d'outils via l'API qwen 3.6 27b

Disponible maintenant

Pré-entraîné

27B Base

Modèle dense de base pour le fine-tuning et les applications spécialisées

Pré-entraîné sur des données diversifiées avec l'architecture Hybrid Gated DeltaNet pour une qualité maximale

Disponible maintenant

Capacités

Un modèle dense qui surpasse sa catégorie

Qwen 3.6 27B combine l'architecture Hybrid Gated DeltaNet avec un contexte de 262K pour offrir des performances qui surpassent des modèles 14 fois plus grands sur les benchmarks de codage réels.

Ingénierie logicielle d'élite

77,2 % sur SWE-bench Verified - dépassant le Qwen 3 MoE 397B (76,2 %). Les résultats du benchmark qwen 3.6 27b prouvent que les architectures denses peuvent égaler les modèles de classe frontière sur le codage réel.

Maîtrise du terminal

59,3 sur Terminal-Bench 2.0, égalant Claude 4.5 Opus. Gère les workflows terminaux complexes multi-étapes, les sessions de débogage et les tâches d'administration système avec une compétence de niveau expert.

Raisonnement avancé

94,1 % sur AIME 2026 en mathématiques et 86,2 sur MMLU-Pro en raisonnement. Le mode de réflexion étape par étape permet une résolution de problèmes transparente en mathématiques, logique et sciences.

Contexte de 262K à 1M

Fenêtre de contexte native de 262K extensible à 1M de tokens. Traitez des bases de code entières, de longs articles de recherche et des conversations multi-tours sans perte de cohérence.

Programmation compétitive

83,9 sur LiveCodeBench v6 pour la programmation compétitive. Excelle dans la résolution de problèmes algorithmiques, la génération de code et les tâches de débogage complexes.

Exécution de compétences pratiques

48,2 sur SkillsBench, surpassant Claude 4.5 Opus (45,3). Démontre une capacité supérieure à suivre des instructions complexes et à exécuter des tâches réelles multi-étapes.

Points clés

Résultats exceptionnels du benchmark qwen 3.6 27b

Qwen 3.6 27B atteint des résultats de classe frontière en codage, raisonnement et benchmarks agentiques tout en maintenant une inférence dense efficace.

Principales réalisations

  • SWE-bench Verified : 77,2 % - surpasse le prédécesseur MoE 397B (76,2 %)
  • Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus
  • SkillsBench : 48,2 - surpasse Claude 4.5 Opus (45,3)
  • AIME 2026 : 94,1 % en mathématiques
  • LiveCodeBench v6 : 83,9 en programmation compétitive

Spécifications techniques

  • 27B paramètres denses, 64 couches, dimension cachée 5120
  • Architecture Hybrid Gated DeltaNet
  • Contexte natif de 262K, extensible à 1M de tokens
  • qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go quantifié
  • Disponible au format qwen 3.6 27b gguf pour le déploiement local

Performance

Un modèle dense de 27B qui surpasse un MoE de 397B en codage réel

Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified et 94,1 % sur AIME 2026, prouvant qu'un modèle dense bien architecturé peut égaler ou surpasser des modèles bien plus grands.

La suite de benchmarks qwen 3.6 27b démontre une excellence constante en ingénierie logicielle, opérations terminales, mathématiques et programmation compétitive - rivalisant ou surpassant des modèles avec plus de 10 fois plus de paramètres.

Graphique de comparaison des performances de Qwen 3.6 27B sur les benchmarks de codage et de raisonnement

SWE-bench Verified : 77,2 % - surpasse le Qwen 3 MoE 397B (76,2 %)

Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus

SkillsBench : 48,2 - surpasse Claude 4.5 Opus à 45,3

AIME 2026 : 94,1 % en mathématiques avancées

MMLU-Pro : 86,2 dans divers domaines de connaissances

Comparaison des benchmarks

Qwen 3.6 27B vs modèles de pointe

Qwen 3.6 27B offre des performances de classe frontière en ingénierie logicielle, opérations terminales, raisonnement et benchmarks de codage. Accédez aux résultats via l'API qwen 3.6 27b.

Benchmark
Qwen 3.6 27B
Dense
En vedette
Qwen 3 235B A22B
MoE
Claude 4.5 Opus
Propriétaire
Qwen 3.6 35B A3B
MoE
SWE-bench Verified
Ingénierie logicielle réelle
77.2%76.2%-73.4%
Terminal-Bench 2.0
Opérations terminales
59.3-59.351.5
SkillsBench
Exécution de tâches réelles
48.2-45.3-
AIME 2026
Mathématiques
No tools
94.1%--92.7%
LiveCodeBench v6
Programmation compétitive
83.9--80.4
MMLU-Pro
Connaissances et raisonnement
86.2---

Résultats des benchmarks issus de la fiche officielle du modèle Qwen 3.6 et des évaluations HuggingFace.

Hybrid Gated DeltaNet

Une nouvelle architecture qui redéfinit l'efficacité des modèles denses

L'architecture Hybrid Gated DeltaNet combine l'attention linéaire avec la récurrence à portes sur 64 couches et une dimension cachée de 5120. Cette conception permet un contexte natif de 262K extensible à 1M de tokens tout en maintenant la simplicité d'inférence d'un modèle dense.

  • 64 couches avec dimension cachée 5120 pour un apprentissage de représentation profond
  • Fenêtre de contexte native de 262K, extensible à 1M de tokens
  • qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go avec quantification (qwen 3.6 27b gguf)
Une nouvelle architecture qui redéfinit l'efficacité des modèles denses

Ingénierie logicielle

77,2 % SWE-bench Verified - le modèle dense qui a battu un MoE de 397B

Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified, surpassant son prédécesseur MoE 397B à 76,2 %. Combiné avec 59,3 sur Terminal-Bench 2.0 (égalant Claude 4.5 Opus) et 83,9 sur LiveCodeBench v6, c'est un assistant complet en ingénierie logicielle accessible via l'API qwen 3.6 27b.

  • 77,2 % SWE-bench Verified - résolution de problèmes GitHub réels
  • 59,3 Terminal-Bench 2.0 - opérations terminales de niveau expert
  • 83,9 LiveCodeBench v6 - excellence en programmation compétitive
77,2 % SWE-bench Verified - le modèle dense qui a battu un MoE de 397B

Déploiement local

Exécutez Qwen 3.6 27B sur votre matériel

Déployez localement avec les poids quantifiés qwen 3.6 27b gguf. Fonctionne sur du matériel grand public avec environ 18 Go de VRAM.

Écosystème Qwen

Membre de la famille de modèles Qwen 3.6

Qwen 3.6 27B fait partie de la dernière famille de modèles d'Alibaba, avec des variantes denses et MoE, un support communautaire étendu et une large compatibilité avec les frameworks.

Documentation

Guides complets pour l'intégration et le déploiement

Lire la doc

HuggingFace

Téléchargez les poids et explorez le hub de modèles

Télécharger

Fiche modèle

Spécifications techniques et résultats d'évaluation

Voir les détails

Dépôt GitHub

Code source, exemples et contributions communautaires

Voir le code

Accès API

Endpoints API qwen 3.6 27b compatibles OpenAI

Commencer

Communauté

Rejoignez la communauté des développeurs Qwen

Rejoindre

Pour commencer

Prêt à construire avec Qwen 3.6 27B ?

Commencez à discuter gratuitement instantanément, ou téléchargez les poids qwen3.6-27b pour un déploiement auto-hébergé sur votre infrastructure.