Qwen 3.6 API

API compatible OpenAI avec preserve_thinking – 12 fois moins cher que Claude Opus 4.6

Accède à Qwen 3.6 Plus, Max et aux modèles open-weight via une API compatible OpenAI. Les tarifs DashScope commencent à 0,40 $ par million de tokens en entrée et 2,40 $ par million de tokens en sortie pour qwen-plus, soit environ 12 fois moins cher que Claude Opus 4.6. Remplacement direct des intégrations OpenAI existantes avec le paramètre preserve_thinking pour maintenir l'état de raisonnement à travers les boucles d'agent. Fenêtre de contexte de 1M de tokens avec jusqu'à 65 536 tokens de sortie. Disponible via DashScope et OpenRouter avec un niveau gratuit.

Commencer à chatter Voir la doc API

Guide API

Intègre Qwen 3.6 dans tes applications avec un minimum de modifications

L'API Qwen 3.6 suit le format chat completions d'OpenAI, ce qui en fait un remplacement direct pour les intégrations existantes. L'extension preserve_thinking ajoute des capacités agentiques sans casser la compatibilité. L'invocation par lots sur DashScope fonctionne à 50 % du tarif temps réel.

Compatibilité OpenAI

Endpoint standard chat completions avec messages, outils et support du streaming. Passe d'OpenAI en changeant simplement l'URL de base et la clé API – aucune modification de code requise. Supporte l'appel de fonctions, le mode JSON, les sorties structurées et les entrées vision/multimodales. Compatible avec Claude Code, OpenClaw, Aider, Continue.dev et tout outil supportant le format API OpenAI. La fenêtre de contexte de 1M supporte jusqu'à 65 536 tokens de sortie par requête.

Tarifs DashScope

Accès API direct via la plateforme DashScope d'Alibaba Cloud avec des tarifs compétitifs. qwen-plus : 0,40 $ par million de tokens en entrée, 2,40 $ par million de tokens en sortie – environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes. Invocation par lots disponible à 50 % du tarif temps réel pour les charges non sensibles à la latence comme le traitement de données, l'évaluation et la génération en masse. Inscris-toi pour une clé API sur dashscope.aliyuncs.com.

Intégration OpenRouter

Accède aux modèles Qwen 3.6 via l'API unifiée d'OpenRouter aux côtés de plus de 200 autres modèles. Niveau gratuit disponible à qwen/qwen3.6-plus:free sans carte bancaire. Le niveau payant utilise des tarifs pass-through plus 5,5 % de frais. Une seule clé API pour un accès multi-fournisseurs avec fallback automatique et répartition de charge. OpenRouter gère les limites de débit et fournit des analyses d'utilisation sur tous tes fournisseurs.

Paramètre preserve_thinking

Extension API unique en son genre qui maintient l'état de raisonnement interne du modèle à travers les itérations de boucle d'agent. Active preserve_thinking: true dans ta requête API pour réduire le re-raisonnement redondant dans les workflows multi-étapes. Cela améliore la précision et réduit la consommation de tokens dans les pipelines agentiques de 15 à 30 % sur les tâches multi-étapes typiques. Essentiel pour construire des boucles d'agent fiables avec Claude Code, OpenClaw et les frameworks agentiques personnalisés.

Invocation par lots (-50 %)

DashScope propose l'invocation par lots à 50 % du tarif temps réel pour les charges qui ne nécessitent pas de réponse immédiate. Soumets des lots de requêtes et récupère les résultats de manière asynchrone. Idéal pour le traitement de jeux de données, l'évaluation de modèles, les pipelines de génération de contenu et tout workflow où la latence n'est pas critique. Les jobs par lots supportent le même format API que les requêtes temps réel.

Fenêtre de contexte 1M

Qwen 3.6 Plus supporte une fenêtre de contexte de 1M de tokens – suffisant pour traiter des bases de code entières, de longs articles de recherche, des documents juridiques et des conversations multi-tours étendues en une seule passe. Combiné avec jusqu'à 65 536 tokens de sortie, cela permet de générer des fichiers complets, des analyses détaillées et des rapports exhaustifs sans troncature. La fenêtre de contexte est disponible sur DashScope et OpenRouter.

Support SDK et frameworks

Fonctionne avec tout SDK compatible OpenAI : Python (openai), Node.js (openai), Go, Rust, Java et plus. Les intégrations LangChain, LlamaIndex, AutoGen, CrewAI et Semantic Kernel sont disponibles nativement. Aucun SDK personnalisé requis – change simplement l'URL de base. Le SDK Python DashScope offre également un accès natif avec des fonctionnalités supplémentaires comme la gestion des lots et le suivi d'utilisation.

Option API auto-hébergée

Pour les équipes nécessitant un contrôle total des données, déploie les modèles open-weight Qwen 3.6 (27B, 35B A3B) avec vLLM, SGLang ou KTransformers pour créer ton propre endpoint API compatible OpenAI. Même format API que DashScope et OpenRouter, donc ton code applicatif fonctionne sans modification. Zéro coût par token après l'investissement matériel.

Référence API

Démarrage rapide avec l'API Qwen 3.6

Endpoints essentiels, tarifs, paramètres et configuration pour démarrer avec l'API Qwen 3.6 via DashScope ou OpenRouter.

Endpoints et fonctionnalités clés

POST /v1/chat/completions – Chat completions (streaming supporté)
POST /v1/embeddings – Embeddings de texte
GET /v1/models – Lister les modèles disponibles
preserve_thinking: true – Activer la persistance de l'état de raisonnement
Fenêtre de contexte 1M, jusqu'à 65 536 tokens de sortie
Appel de fonctions, mode JSON, sorties structurées, vision

Tarifs (DashScope)

qwen-plus entrée : 0,40 $ par million de tokens
qwen-plus sortie : 2,40 $ par million de tokens
Invocation par lots : 50 % du tarif temps réel
Environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes
Niveau gratuit OpenRouter : qwen/qwen3.6-plus:free (sans carte bancaire)
OpenRouter payant : tarif pass-through + 5,5 % de frais

Modèles disponibles

qwen-3.6-plus – Modèle phare, contexte 1M, preserve_thinking
qwen-3.6-max – Raisonnement avancé, multimodal
qwen-3.6-27b – Open-weight dense, meilleure performance coding
qwen-3.6-35b-a3b – Open-weight MoE, rapport qualité-prix
Auto-hébergé via vLLM, SGLang, KTransformers

Commencer à chatter Documentation API

Pour commencer

Commence à développer avec l'API Qwen 3.6 en quelques minutes

Obtiens ta clé API et envoie ta première requête. Le format compatible OpenAI te permet de démarrer avec des outils et SDKs familiers.

Démarrage rapide DashScope

Inscris-toi et obtiens ta clé API depuis Alibaba Cloud DashScope

Configuration OpenRouter

Accède à Qwen 3.6 via OpenRouter – niveau gratuit disponible

Guide SDK Python

Utilise le SDK Python OpenAI standard avec Qwen 3.6

Guide SDK Node.js

Intègre Qwen 3.6 dans tes applications Node.js

Guide invocation par lots

Soumets des jobs par lots à 50 % du tarif pour les charges en masse

tag

Calculateur de tarifs

Estime les coûts pour ta charge vs Claude, GPT-4o, Gemini

Utilisation avancée

Construis des workflows agentiques avec preserve_thinking et l'appel d'outils

Exploite le paramètre preserve_thinking, l'appel de fonctions et le contexte 1M pour des pipelines d'agents multi-étapes complexes et des applications de production.

Frameworks d'agents

Intégration LangChain, AutoGen, CrewAI et Semantic Kernel

Guide appel d'outils

Appel de fonctions, protocole MCP et utilisation structurée d'outils

Guide streaming

Server-sent events pour des réponses en temps réel et suivi de progression

Intégration Claude Code

Utilise Qwen 3.6 comme backend pour Claude Code via l'API

Déploiement auto-hébergé

Déploie avec vLLM ou SGLang pour zéro coût par token

Écosystème Qwen

Un format d'API, plusieurs points d'accès, tarifs leaders du marché

Accède à Qwen 3.6 via DashScope (0,40 $/2,40 $ par M tokens), OpenRouter (niveau gratuit disponible) ou vLLM auto-hébergé – le tout avec le même format d'API compatible OpenAI et le support de preserve_thinking.

Explorer tous les modèles Documentation API

DashScope

API directe, 0,40 $/2,40 $ par M tokens

S'inscrire

OpenRouter

API unifiée avec niveau gratuit

Commencer

vLLM auto-hébergé

Ton propre endpoint API, zéro coût par token

Déployer

Python SDK

Bibliothèque Python OpenAI standard, remplacement direct

Installer

Référence API

Documentation complète des endpoints et paramètres

Lire la doc

Tarifs

Tarification à l'usage, lots à -50 %

Voir les tarifs

Pour commencer

Prêt à intégrer Qwen 3.6 ? Commence avec le niveau gratuit, monte en charge à 0,40 $/M tokens

Commence à chatter gratuitement, puis intègre via l'API compatible OpenAI. Remplacement direct avec preserve_thinking pour les workflows agentiques. DashScope à 0,40 $/2,40 $ par million de tokens ou niveau gratuit OpenRouter – sans carte bancaire.

Commencer à chatter Documentation API