Qwen 3.6 27B

27 milliards de paramètres, architecture dense - surpasse son prédécesseur MoE de 397B

Qwen 3.6 27B est un modèle dense basé sur l'architecture Hybrid Gated DeltaNet avec 64 couches et un contexte natif de 262K. Il atteint 77,2 % sur SWE-bench Verified, dépassant le Qwen 3 MoE 397B à 76,2 %, tout en tenant dans environ 55,6 Go de VRAM en FP16 ou environ 18 Go avec quantification.

Commencer à discuter Voir les benchmarks

Variantes du modèle

Architecture dense, qualité maximale par paramètre

Qwen 3.6 27B offre des performances de classe frontière dans un format dense de 27B. Choisissez la variante instruction-tuned pour le chat et les tâches agentiques, ou le modèle de base pour le fine-tuning.

Architecture Hybrid Gated DeltaNet

27B paramètres denses, 64 couches, dimension cachée 5120

Qwen 3.6 27B utilise une conception Hybrid Gated DeltaNet qui combine l'efficacité de l'attention linéaire avec la récurrence à portes. La fenêtre de contexte native de 262K est extensible à 1M de tokens, ce qui le rend idéal pour l'analyse de longs documents et les workflows agentiques complexes.

Avec des besoins en VRAM d'environ 55,6 Go en FP16 ou environ 18 Go quantifié, ce modèle fonctionne sur un seul GPU haut de gamme ou deux GPU grand public au format qwen 3.6 27b gguf.

Commencer à discuter Voir les capacités

Instruction-tuned

27B Instruct

Optimisé pour l'IA conversationnelle, le codage et les tâches agentiques complexes

Fine-tuné pour le suivi d'instructions, le dialogue multi-tours et l'utilisation d'outils via l'API qwen 3.6 27b

Disponible maintenant

Commencer à discuter Télécharger les poids

Pré-entraîné

27B Base

Modèle dense de base pour le fine-tuning et les applications spécialisées

Pré-entraîné sur des données diversifiées avec l'architecture Hybrid Gated DeltaNet pour une qualité maximale

Disponible maintenant

Voir sur HuggingFace Guide de fine-tuning

Capacités

Un modèle dense qui surpasse sa catégorie

Qwen 3.6 27B combine l'architecture Hybrid Gated DeltaNet avec un contexte de 262K pour offrir des performances qui surpassent des modèles 14 fois plus grands sur les benchmarks de codage réels.

Ingénierie logicielle d'élite

77,2 % sur SWE-bench Verified - dépassant le Qwen 3 MoE 397B (76,2 %). Les résultats du benchmark qwen 3.6 27b prouvent que les architectures denses peuvent égaler les modèles de classe frontière sur le codage réel.

Maîtrise du terminal

59,3 sur Terminal-Bench 2.0, égalant Claude 4.5 Opus. Gère les workflows terminaux complexes multi-étapes, les sessions de débogage et les tâches d'administration système avec une compétence de niveau expert.

Raisonnement avancé

94,1 % sur AIME 2026 en mathématiques et 86,2 sur MMLU-Pro en raisonnement. Le mode de réflexion étape par étape permet une résolution de problèmes transparente en mathématiques, logique et sciences.

Contexte de 262K à 1M

Fenêtre de contexte native de 262K extensible à 1M de tokens. Traitez des bases de code entières, de longs articles de recherche et des conversations multi-tours sans perte de cohérence.

Programmation compétitive

83,9 sur LiveCodeBench v6 pour la programmation compétitive. Excelle dans la résolution de problèmes algorithmiques, la génération de code et les tâches de débogage complexes.

Exécution de compétences pratiques

48,2 sur SkillsBench, surpassant Claude 4.5 Opus (45,3). Démontre une capacité supérieure à suivre des instructions complexes et à exécuter des tâches réelles multi-étapes.

Points clés

Résultats exceptionnels du benchmark qwen 3.6 27b

Qwen 3.6 27B atteint des résultats de classe frontière en codage, raisonnement et benchmarks agentiques tout en maintenant une inférence dense efficace.

Principales réalisations

SWE-bench Verified : 77,2 % - surpasse le prédécesseur MoE 397B (76,2 %)
Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus
SkillsBench : 48,2 - surpasse Claude 4.5 Opus (45,3)
AIME 2026 : 94,1 % en mathématiques
LiveCodeBench v6 : 83,9 en programmation compétitive

Spécifications techniques

27B paramètres denses, 64 couches, dimension cachée 5120
Architecture Hybrid Gated DeltaNet
Contexte natif de 262K, extensible à 1M de tokens
qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go quantifié
Disponible au format qwen 3.6 27b gguf pour le déploiement local

Démarrer le chat gratuit Télécharger les poids

Performance

Un modèle dense de 27B qui surpasse un MoE de 397B en codage réel

Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified et 94,1 % sur AIME 2026, prouvant qu'un modèle dense bien architecturé peut égaler ou surpasser des modèles bien plus grands.

La suite de benchmarks qwen 3.6 27b démontre une excellence constante en ingénierie logicielle, opérations terminales, mathématiques et programmation compétitive - rivalisant ou surpassant des modèles avec plus de 10 fois plus de paramètres.

Commencer à discuter Voir la fiche modèle

Graphique de comparaison des performances de Qwen 3.6 27B sur les benchmarks de codage et de raisonnement

SWE-bench Verified : 77,2 % - surpasse le Qwen 3 MoE 397B (76,2 %)

Terminal-Bench 2.0 : 59,3 - égale Claude 4.5 Opus

SkillsBench : 48,2 - surpasse Claude 4.5 Opus à 45,3

AIME 2026 : 94,1 % en mathématiques avancées

MMLU-Pro : 86,2 dans divers domaines de connaissances

Comparaison des benchmarks

Qwen 3.6 27B vs modèles de pointe

Qwen 3.6 27B offre des performances de classe frontière en ingénierie logicielle, opérations terminales, raisonnement et benchmarks de codage. Accédez aux résultats via l'API qwen 3.6 27b.

Benchmark	Qwen 3.6 27B Dense En vedette	Qwen 3 235B A22B MoE	Claude 4.5 Opus Propriétaire	Qwen 3.6 35B A3B MoE
SWE-bench Verified Ingénierie logicielle réelle	77.2%	76.2%	-	73.4%
Terminal-Bench 2.0 Opérations terminales	59.3	-	59.3	51.5
SkillsBench Exécution de tâches réelles	48.2	-	45.3	-
AIME 2026 Mathématiques No tools	94.1%	-	-	92.7%
LiveCodeBench v6 Programmation compétitive	83.9	-	-	80.4
MMLU-Pro Connaissances et raisonnement	86.2	-	-	-

Résultats des benchmarks issus de la fiche officielle du modèle Qwen 3.6 et des évaluations HuggingFace.

Hybrid Gated DeltaNet

Une nouvelle architecture qui redéfinit l'efficacité des modèles denses

L'architecture Hybrid Gated DeltaNet combine l'attention linéaire avec la récurrence à portes sur 64 couches et une dimension cachée de 5120. Cette conception permet un contexte natif de 262K extensible à 1M de tokens tout en maintenant la simplicité d'inférence d'un modèle dense.

64 couches avec dimension cachée 5120 pour un apprentissage de représentation profond
Fenêtre de contexte native de 262K, extensible à 1M de tokens
qwen 3.6 27b vram : environ 55,6 Go FP16, environ 18 Go avec quantification (qwen 3.6 27b gguf)

Commencer à discuter Voir les détails de l'architecture

Une nouvelle architecture qui redéfinit l'efficacité des modèles denses

Ingénierie logicielle

77,2 % SWE-bench Verified - le modèle dense qui a battu un MoE de 397B

Qwen 3.6 27B atteint 77,2 % sur SWE-bench Verified, surpassant son prédécesseur MoE 397B à 76,2 %. Combiné avec 59,3 sur Terminal-Bench 2.0 (égalant Claude 4.5 Opus) et 83,9 sur LiveCodeBench v6, c'est un assistant complet en ingénierie logicielle accessible via l'API qwen 3.6 27b.

77,2 % SWE-bench Verified - résolution de problèmes GitHub réels
59,3 Terminal-Bench 2.0 - opérations terminales de niveau expert
83,9 LiveCodeBench v6 - excellence en programmation compétitive

Essayer des tâches de codage Voir les benchmarks

77,2 % SWE-bench Verified - le modèle dense qui a battu un MoE de 397B

Pour commencer

Essayez Qwen 3.6 27B maintenant

Commencez à discuter instantanément via l'API qwen 3.6 27b, ou téléchargez les poids pour un déploiement auto-hébergé.

Discuter avec Qwen 3.6 27B

Essayez qwen3.6-27b instantanément - aucune configuration requise

Documentation API

Intégration via l'API qwen 3.6 27b avec des endpoints compatibles OpenAI

Fiche modèle

Spécifications techniques complètes et résultats du benchmark qwen 3.6 27b

HuggingFace

Dépôt officiel du modèle avec poids et documentation

Déploiement local

Exécutez Qwen 3.6 27B sur votre matériel

Déployez localement avec les poids quantifiés qwen 3.6 27b gguf. Fonctionne sur du matériel grand public avec environ 18 Go de VRAM.

Poids GGUF

Téléchargez qwen 3.6 27b gguf pour llama.cpp et Ollama

Ollama

Déploiement local en une seule commande

vLLM

Service à haut débit pour la production

Écosystème Qwen

Membre de la famille de modèles Qwen 3.6

Qwen 3.6 27B fait partie de la dernière famille de modèles d'Alibaba, avec des variantes denses et MoE, un support communautaire étendu et une large compatibilité avec les frameworks.

Explorer les modèles Qwen Page officielle