Modèles Qwen 3.6

Quatre modèles, une famille — du Mac M4 16 Go aux performances de pointe à $0.40/M tokens

La famille Qwen 3.6 couvre des modèles propriétaires hébergés et des versions open-weight. Plus offre 78.8% SWE-bench avec 1M de contexte et preserve_thinking à $0.40/$2.40 par million de tokens (12x moins cher que Claude Opus 4.6). Max gère le raisonnement avancé et les tâches multimodales. Le modèle dense 27B atteint 77.2% SWE-bench et 48.2 SkillsBench (dépassant Claude 4.5 Opus). Le 35B A3B MoE tourne sur Mac M4 16 Go en quantification Q3 à 20-40 tok/s. Tous les modèles partagent la même base architecturale et une API compatible OpenAI.

Famille de modèles

Choisissez le bon modèle Qwen 3.6 pour votre cas d'usage et votre budget

Du déploiement local léger sur un ordinateur portable aux performances maximales hébergées avec 1M de contexte, la famille Qwen 3.6 couvre chaque échelle, budget et scénario de déploiement.

Propriétaires

Modèles hébergés avec performances maximales et 1M de contexte

Plus et Max sont des modèles propriétaires disponibles via API. Ils offrent les meilleures performances, des fenêtres de contexte de 1M, jusqu'à 65 536 tokens en sortie, et des fonctionnalités comme preserve_thinking exclusives au niveau hébergé. La tarification DashScope commence à $0.40 par million de tokens en entrée — environ 12x moins cher que Claude Opus 4.6. Invocation par lots disponible à 50% du prix temps réel.

Disponibles via API compatible OpenAI sur DashScope et OpenRouter (offre gratuite disponible)

Open-weight

Exécutez sur votre propre matériel avec un contrôle total — licence Apache 2.0

Les modèles dense 27B et MoE 35B A3B sont publiés sous licence Apache 2.0. Déployez localement avec Ollama, vLLM, llama.cpp, SGLang ou KTransformers. Le 27B tient dans 16 Go VRAM avec IQ4_XS GGUF et compression du cache KV. Le 35B A3B tourne sur Mac M4 16 Go en quantification Q3. Zéro coût par token, confidentialité totale des données et liberté de fine-tuning.

Disponibles sur HuggingFace, Ollama et les dépôts GGUF

Qwen 3.6 Plus

Propriétaire

Modèle propriétaire phare avec 1M de contexte, preserve_thinking pour les workflows agentiques et performances de premier plan. 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 56.6 SWE-bench Pro. Tarification DashScope : $0.40 entrée / $2.40 sortie par million de tokens, environ 12x moins cher que Claude Opus 4.6. Lots à 50%. Jusqu'à 65 536 tokens en sortie par requête.

Fenêtre de contexte 1M, paramètre preserve_thinking, 65K tokens en sortie, lots à 50%

Accès API via DashScope et OpenRouter (offre gratuite en préversion disponible)

Qwen 3.6 Max

Propriétaire

Modèle propriétaire haute performance optimisé pour le raisonnement complexe, les tâches multimodales et la compréhension de documents. Performant en mathématiques, sciences, analyse visuelle et traitement de documents longs. Fenêtre de contexte étendue avec des capacités de raisonnement avancées pour les tâches analytiques les plus exigeantes.

Contexte étendu, capacités multimodales, raisonnement avancé, compréhension de documents

Accès API via DashScope et OpenRouter

Qwen 3.6 27B

Open-weight

Modèle dense à 27B paramètres offrant les meilleures performances open-weight en programmation. 77.2% SWE-bench Verified, 59.3 Terminal-Bench 2.0, 83.9 LiveCodeBench, 48.2 SkillsBench (dépasse Claude 4.5 Opus à 45.3), 1487 QwenWebBench, 36.2 NL2Repo, 72.4 Claw-Eval. Tourne sur 16 Go VRAM avec IQ4_XS GGUF et compression du cache KV supportant 100K de contexte.

55.6 Go FP16, 16 Go VRAM avec IQ4_XS + compression cache KV, architecture dense, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), téléchargements GGUF

Qwen 3.6 35B A3B

Open-weight

Modèle MoE avec 35B au total / 3B paramètres actifs. Performances proches du 27B dans un format compatible GPU grand public. 73.4% SWE-bench Verified, 51.5 Terminal-Bench 2.0, 80.4 LiveCodeBench, 68.7 Claw-Eval, 1397 QwenWebBench. Tourne sur Mac M4 16 Go en quantification Q3 (~17 Go). 20-40 tok/s sur matériel grand public en 4-bit. Vision et multimodal supportés.

~21 Go Q4_K_M, ~17 Go Q3_K_M (Mac M4 16 Go), 3B paramètres actifs, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), téléchargements GGUF

Écosystème Qwen

Une famille de modèles unifiée pour chaque scénario de déploiement et budget

De l'API cloud à $0.40/M tokens au déploiement sur Mac M4, la famille Qwen 3.6 offre une qualité constante, des interfaces compatibles et un rapport qualité-prix leader du marché sur toutes les cibles de déploiement.

Qwen 3.6 Plus

78.8% SWE-bench, 1M de contexte, $0.40/M tokens

Essayer Plus

Qwen 3.6 Max

Raisonnement avancé et multimodal

Essayer Max

Qwen 3.6 27B

77.2% SWE-bench, dépasse Claude sur SkillsBench

Essayer le 27B

Qwen 3.6 35B A3B

73.4% SWE-bench, compatible Mac M4 16 Go

Essayer le 35B

Référence API

Endpoints compatibles OpenAI, preserve_thinking

Voir l'API

Communauté

Rejoignez la communauté des développeurs Qwen

Rejoindre

Commencer

Prêt à explorer la famille Qwen 3.6 ? Essayez gratuitement, déployez partout

Essayez n'importe quel modèle Qwen 3.6 gratuitement dans le navigateur ou via l'offre gratuite OpenRouter. Téléchargez les modèles open-weight sous Apache 2.0 pour les exécuter sur votre propre matériel. Du Mac M4 16 Go aux serveurs de production, de l'API à $0.40/M tokens au déploiement local sans coût.