Qwen 3.6 API
API compatible OpenAI avec preserve_thinking – 12 fois moins cher que Claude Opus 4.6
Accède à Qwen 3.6 Plus, Max et aux modèles open-weight via une API compatible OpenAI. Les tarifs DashScope commencent à 0,40 $ par million de tokens en entrée et 2,40 $ par million de tokens en sortie pour qwen-plus, soit environ 12 fois moins cher que Claude Opus 4.6. Remplacement direct des intégrations OpenAI existantes avec le paramètre preserve_thinking pour maintenir l'état de raisonnement à travers les boucles d'agent. Fenêtre de contexte de 1M de tokens avec jusqu'à 65 536 tokens de sortie. Disponible via DashScope et OpenRouter avec un niveau gratuit.
Guide API
Intègre Qwen 3.6 dans tes applications avec un minimum de modifications
L'API Qwen 3.6 suit le format chat completions d'OpenAI, ce qui en fait un remplacement direct pour les intégrations existantes. L'extension preserve_thinking ajoute des capacités agentiques sans casser la compatibilité. L'invocation par lots sur DashScope fonctionne à 50 % du tarif temps réel.
Compatibilité OpenAI
Endpoint standard chat completions avec messages, outils et support du streaming. Passe d'OpenAI en changeant simplement l'URL de base et la clé API – aucune modification de code requise. Supporte l'appel de fonctions, le mode JSON, les sorties structurées et les entrées vision/multimodales. Compatible avec Claude Code, OpenClaw, Aider, Continue.dev et tout outil supportant le format API OpenAI. La fenêtre de contexte de 1M supporte jusqu'à 65 536 tokens de sortie par requête.
Tarifs DashScope
Accès API direct via la plateforme DashScope d'Alibaba Cloud avec des tarifs compétitifs. qwen-plus : 0,40 $ par million de tokens en entrée, 2,40 $ par million de tokens en sortie – environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes. Invocation par lots disponible à 50 % du tarif temps réel pour les charges non sensibles à la latence comme le traitement de données, l'évaluation et la génération en masse. Inscris-toi pour une clé API sur dashscope.aliyuncs.com.
Intégration OpenRouter
Accède aux modèles Qwen 3.6 via l'API unifiée d'OpenRouter aux côtés de plus de 200 autres modèles. Niveau gratuit disponible à qwen/qwen3.6-plus:free sans carte bancaire. Le niveau payant utilise des tarifs pass-through plus 5,5 % de frais. Une seule clé API pour un accès multi-fournisseurs avec fallback automatique et répartition de charge. OpenRouter gère les limites de débit et fournit des analyses d'utilisation sur tous tes fournisseurs.
Paramètre preserve_thinking
Extension API unique en son genre qui maintient l'état de raisonnement interne du modèle à travers les itérations de boucle d'agent. Active preserve_thinking: true dans ta requête API pour réduire le re-raisonnement redondant dans les workflows multi-étapes. Cela améliore la précision et réduit la consommation de tokens dans les pipelines agentiques de 15 à 30 % sur les tâches multi-étapes typiques. Essentiel pour construire des boucles d'agent fiables avec Claude Code, OpenClaw et les frameworks agentiques personnalisés.
Invocation par lots (-50 %)
DashScope propose l'invocation par lots à 50 % du tarif temps réel pour les charges qui ne nécessitent pas de réponse immédiate. Soumets des lots de requêtes et récupère les résultats de manière asynchrone. Idéal pour le traitement de jeux de données, l'évaluation de modèles, les pipelines de génération de contenu et tout workflow où la latence n'est pas critique. Les jobs par lots supportent le même format API que les requêtes temps réel.
Fenêtre de contexte 1M
Qwen 3.6 Plus supporte une fenêtre de contexte de 1M de tokens – suffisant pour traiter des bases de code entières, de longs articles de recherche, des documents juridiques et des conversations multi-tours étendues en une seule passe. Combiné avec jusqu'à 65 536 tokens de sortie, cela permet de générer des fichiers complets, des analyses détaillées et des rapports exhaustifs sans troncature. La fenêtre de contexte est disponible sur DashScope et OpenRouter.
Support SDK et frameworks
Fonctionne avec tout SDK compatible OpenAI : Python (openai), Node.js (openai), Go, Rust, Java et plus. Les intégrations LangChain, LlamaIndex, AutoGen, CrewAI et Semantic Kernel sont disponibles nativement. Aucun SDK personnalisé requis – change simplement l'URL de base. Le SDK Python DashScope offre également un accès natif avec des fonctionnalités supplémentaires comme la gestion des lots et le suivi d'utilisation.
Option API auto-hébergée
Pour les équipes nécessitant un contrôle total des données, déploie les modèles open-weight Qwen 3.6 (27B, 35B A3B) avec vLLM, SGLang ou KTransformers pour créer ton propre endpoint API compatible OpenAI. Même format API que DashScope et OpenRouter, donc ton code applicatif fonctionne sans modification. Zéro coût par token après l'investissement matériel.
Référence API
Démarrage rapide avec l'API Qwen 3.6
Endpoints essentiels, tarifs, paramètres et configuration pour démarrer avec l'API Qwen 3.6 via DashScope ou OpenRouter.
Endpoints et fonctionnalités clés
- POST /v1/chat/completions – Chat completions (streaming supporté)
- POST /v1/embeddings – Embeddings de texte
- GET /v1/models – Lister les modèles disponibles
- preserve_thinking: true – Activer la persistance de l'état de raisonnement
- Fenêtre de contexte 1M, jusqu'à 65 536 tokens de sortie
- Appel de fonctions, mode JSON, sorties structurées, vision
Tarifs (DashScope)
- qwen-plus entrée : 0,40 $ par million de tokens
- qwen-plus sortie : 2,40 $ par million de tokens
- Invocation par lots : 50 % du tarif temps réel
- Environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes
- Niveau gratuit OpenRouter : qwen/qwen3.6-plus:free (sans carte bancaire)
- OpenRouter payant : tarif pass-through + 5,5 % de frais
Modèles disponibles
- qwen-3.6-plus – Modèle phare, contexte 1M, preserve_thinking
- qwen-3.6-max – Raisonnement avancé, multimodal
- qwen-3.6-27b – Open-weight dense, meilleure performance coding
- qwen-3.6-35b-a3b – Open-weight MoE, rapport qualité-prix
- Auto-hébergé via vLLM, SGLang, KTransformers
Pour commencer
Commence à développer avec l'API Qwen 3.6 en quelques minutes
Obtiens ta clé API et envoie ta première requête. Le format compatible OpenAI te permet de démarrer avec des outils et SDKs familiers.
Inscris-toi et obtiens ta clé API depuis Alibaba Cloud DashScope
Accède à Qwen 3.6 via OpenRouter – niveau gratuit disponible
Utilise le SDK Python OpenAI standard avec Qwen 3.6
Intègre Qwen 3.6 dans tes applications Node.js
Soumets des jobs par lots à 50 % du tarif pour les charges en masse
Estime les coûts pour ta charge vs Claude, GPT-4o, Gemini
Utilisation avancée
Construis des workflows agentiques avec preserve_thinking et l'appel d'outils
Exploite le paramètre preserve_thinking, l'appel de fonctions et le contexte 1M pour des pipelines d'agents multi-étapes complexes et des applications de production.
Intégration LangChain, AutoGen, CrewAI et Semantic Kernel
Appel de fonctions, protocole MCP et utilisation structurée d'outils
Server-sent events pour des réponses en temps réel et suivi de progression
Utilise Qwen 3.6 comme backend pour Claude Code via l'API
Déploie avec vLLM ou SGLang pour zéro coût par token
Écosystème Qwen
Un format d'API, plusieurs points d'accès, tarifs leaders du marché
Accède à Qwen 3.6 via DashScope (0,40 $/2,40 $ par M tokens), OpenRouter (niveau gratuit disponible) ou vLLM auto-hébergé – le tout avec le même format d'API compatible OpenAI et le support de preserve_thinking.
Pour commencer
Prêt à intégrer Qwen 3.6 ? Commence avec le niveau gratuit, monte en charge à 0,40 $/M tokens
Commence à chatter gratuitement, puis intègre via l'API compatible OpenAI. Remplacement direct avec preserve_thinking pour les workflows agentiques. DashScope à 0,40 $/2,40 $ par million de tokens ou niveau gratuit OpenRouter – sans carte bancaire.