Modèles Qwen 3.6
Quatre modèles, une famille — du Mac M4 16 Go aux performances de pointe à $0.40/M tokens
La famille Qwen 3.6 couvre des modèles propriétaires hébergés et des versions open-weight. Plus offre 78.8% SWE-bench avec 1M de contexte et preserve_thinking à $0.40/$2.40 par million de tokens (12x moins cher que Claude Opus 4.6). Max gère le raisonnement avancé et les tâches multimodales. Le modèle dense 27B atteint 77.2% SWE-bench et 48.2 SkillsBench (dépassant Claude 4.5 Opus). Le 35B A3B MoE tourne sur Mac M4 16 Go en quantification Q3 à 20-40 tok/s. Tous les modèles partagent la même base architecturale et une API compatible OpenAI.
Famille de modèles
Choisissez le bon modèle Qwen 3.6 pour votre cas d'usage et votre budget
Du déploiement local léger sur un ordinateur portable aux performances maximales hébergées avec 1M de contexte, la famille Qwen 3.6 couvre chaque échelle, budget et scénario de déploiement.
Propriétaires
Modèles hébergés avec performances maximales et 1M de contexte
Plus et Max sont des modèles propriétaires disponibles via API. Ils offrent les meilleures performances, des fenêtres de contexte de 1M, jusqu'à 65 536 tokens en sortie, et des fonctionnalités comme preserve_thinking exclusives au niveau hébergé. La tarification DashScope commence à $0.40 par million de tokens en entrée — environ 12x moins cher que Claude Opus 4.6. Invocation par lots disponible à 50% du prix temps réel.
Disponibles via API compatible OpenAI sur DashScope et OpenRouter (offre gratuite disponible)
Open-weight
Exécutez sur votre propre matériel avec un contrôle total — licence Apache 2.0
Les modèles dense 27B et MoE 35B A3B sont publiés sous licence Apache 2.0. Déployez localement avec Ollama, vLLM, llama.cpp, SGLang ou KTransformers. Le 27B tient dans 16 Go VRAM avec IQ4_XS GGUF et compression du cache KV. Le 35B A3B tourne sur Mac M4 16 Go en quantification Q3. Zéro coût par token, confidentialité totale des données et liberté de fine-tuning.
Disponibles sur HuggingFace, Ollama et les dépôts GGUF
Qwen 3.6 Plus
Propriétaire
Modèle propriétaire phare avec 1M de contexte, preserve_thinking pour les workflows agentiques et performances de premier plan. 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 56.6 SWE-bench Pro. Tarification DashScope : $0.40 entrée / $2.40 sortie par million de tokens, environ 12x moins cher que Claude Opus 4.6. Lots à 50%. Jusqu'à 65 536 tokens en sortie par requête.
Fenêtre de contexte 1M, paramètre preserve_thinking, 65K tokens en sortie, lots à 50%
Qwen 3.6 Max
Propriétaire
Modèle propriétaire haute performance optimisé pour le raisonnement complexe, les tâches multimodales et la compréhension de documents. Performant en mathématiques, sciences, analyse visuelle et traitement de documents longs. Fenêtre de contexte étendue avec des capacités de raisonnement avancées pour les tâches analytiques les plus exigeantes.
Contexte étendu, capacités multimodales, raisonnement avancé, compréhension de documents
Qwen 3.6 27B
Open-weight
Modèle dense à 27B paramètres offrant les meilleures performances open-weight en programmation. 77.2% SWE-bench Verified, 59.3 Terminal-Bench 2.0, 83.9 LiveCodeBench, 48.2 SkillsBench (dépasse Claude 4.5 Opus à 45.3), 1487 QwenWebBench, 36.2 NL2Repo, 72.4 Claw-Eval. Tourne sur 16 Go VRAM avec IQ4_XS GGUF et compression du cache KV supportant 100K de contexte.
55.6 Go FP16, 16 Go VRAM avec IQ4_XS + compression cache KV, architecture dense, Apache 2.0
Qwen 3.6 35B A3B
Open-weight
Modèle MoE avec 35B au total / 3B paramètres actifs. Performances proches du 27B dans un format compatible GPU grand public. 73.4% SWE-bench Verified, 51.5 Terminal-Bench 2.0, 80.4 LiveCodeBench, 68.7 Claw-Eval, 1397 QwenWebBench. Tourne sur Mac M4 16 Go en quantification Q3 (~17 Go). 20-40 tok/s sur matériel grand public en 4-bit. Vision et multimodal supportés.
~21 Go Q4_K_M, ~17 Go Q3_K_M (Mac M4 16 Go), 3B paramètres actifs, 20-40 tok/s, Apache 2.0
Écosystème Qwen
Une famille de modèles unifiée pour chaque scénario de déploiement et budget
De l'API cloud à $0.40/M tokens au déploiement sur Mac M4, la famille Qwen 3.6 offre une qualité constante, des interfaces compatibles et un rapport qualité-prix leader du marché sur toutes les cibles de déploiement.
Commencer
Prêt à explorer la famille Qwen 3.6 ? Essayez gratuitement, déployez partout
Essayez n'importe quel modèle Qwen 3.6 gratuitement dans le navigateur ou via l'offre gratuite OpenRouter. Téléchargez les modèles open-weight sous Apache 2.0 pour les exécuter sur votre propre matériel. Du Mac M4 16 Go aux serveurs de production, de l'API à $0.40/M tokens au déploiement local sans coût.