Qwen 3.6 API

API compatible OpenAI avec preserve_thinking – 12 fois moins cher que Claude Opus 4.6

Accède à Qwen 3.6 Plus, Max et aux modèles open-weight via une API compatible OpenAI. Les tarifs DashScope commencent à 0,40 $ par million de tokens en entrée et 2,40 $ par million de tokens en sortie pour qwen-plus, soit environ 12 fois moins cher que Claude Opus 4.6. Remplacement direct des intégrations OpenAI existantes avec le paramètre preserve_thinking pour maintenir l'état de raisonnement à travers les boucles d'agent. Fenêtre de contexte de 1M de tokens avec jusqu'à 65 536 tokens de sortie. Disponible via DashScope et OpenRouter avec un niveau gratuit.

Guide API

Intègre Qwen 3.6 dans tes applications avec un minimum de modifications

L'API Qwen 3.6 suit le format chat completions d'OpenAI, ce qui en fait un remplacement direct pour les intégrations existantes. L'extension preserve_thinking ajoute des capacités agentiques sans casser la compatibilité. L'invocation par lots sur DashScope fonctionne à 50 % du tarif temps réel.

Compatibilité OpenAI

Endpoint standard chat completions avec messages, outils et support du streaming. Passe d'OpenAI en changeant simplement l'URL de base et la clé API – aucune modification de code requise. Supporte l'appel de fonctions, le mode JSON, les sorties structurées et les entrées vision/multimodales. Compatible avec Claude Code, OpenClaw, Aider, Continue.dev et tout outil supportant le format API OpenAI. La fenêtre de contexte de 1M supporte jusqu'à 65 536 tokens de sortie par requête.

Tarifs DashScope

Accès API direct via la plateforme DashScope d'Alibaba Cloud avec des tarifs compétitifs. qwen-plus : 0,40 $ par million de tokens en entrée, 2,40 $ par million de tokens en sortie – environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes. Invocation par lots disponible à 50 % du tarif temps réel pour les charges non sensibles à la latence comme le traitement de données, l'évaluation et la génération en masse. Inscris-toi pour une clé API sur dashscope.aliyuncs.com.

Intégration OpenRouter

Accède aux modèles Qwen 3.6 via l'API unifiée d'OpenRouter aux côtés de plus de 200 autres modèles. Niveau gratuit disponible à qwen/qwen3.6-plus:free sans carte bancaire. Le niveau payant utilise des tarifs pass-through plus 5,5 % de frais. Une seule clé API pour un accès multi-fournisseurs avec fallback automatique et répartition de charge. OpenRouter gère les limites de débit et fournit des analyses d'utilisation sur tous tes fournisseurs.

Paramètre preserve_thinking

Extension API unique en son genre qui maintient l'état de raisonnement interne du modèle à travers les itérations de boucle d'agent. Active preserve_thinking: true dans ta requête API pour réduire le re-raisonnement redondant dans les workflows multi-étapes. Cela améliore la précision et réduit la consommation de tokens dans les pipelines agentiques de 15 à 30 % sur les tâches multi-étapes typiques. Essentiel pour construire des boucles d'agent fiables avec Claude Code, OpenClaw et les frameworks agentiques personnalisés.

Invocation par lots (-50 %)

DashScope propose l'invocation par lots à 50 % du tarif temps réel pour les charges qui ne nécessitent pas de réponse immédiate. Soumets des lots de requêtes et récupère les résultats de manière asynchrone. Idéal pour le traitement de jeux de données, l'évaluation de modèles, les pipelines de génération de contenu et tout workflow où la latence n'est pas critique. Les jobs par lots supportent le même format API que les requêtes temps réel.

Fenêtre de contexte 1M

Qwen 3.6 Plus supporte une fenêtre de contexte de 1M de tokens – suffisant pour traiter des bases de code entières, de longs articles de recherche, des documents juridiques et des conversations multi-tours étendues en une seule passe. Combiné avec jusqu'à 65 536 tokens de sortie, cela permet de générer des fichiers complets, des analyses détaillées et des rapports exhaustifs sans troncature. La fenêtre de contexte est disponible sur DashScope et OpenRouter.

Support SDK et frameworks

Fonctionne avec tout SDK compatible OpenAI : Python (openai), Node.js (openai), Go, Rust, Java et plus. Les intégrations LangChain, LlamaIndex, AutoGen, CrewAI et Semantic Kernel sont disponibles nativement. Aucun SDK personnalisé requis – change simplement l'URL de base. Le SDK Python DashScope offre également un accès natif avec des fonctionnalités supplémentaires comme la gestion des lots et le suivi d'utilisation.

Option API auto-hébergée

Pour les équipes nécessitant un contrôle total des données, déploie les modèles open-weight Qwen 3.6 (27B, 35B A3B) avec vLLM, SGLang ou KTransformers pour créer ton propre endpoint API compatible OpenAI. Même format API que DashScope et OpenRouter, donc ton code applicatif fonctionne sans modification. Zéro coût par token après l'investissement matériel.

Référence API

Démarrage rapide avec l'API Qwen 3.6

Endpoints essentiels, tarifs, paramètres et configuration pour démarrer avec l'API Qwen 3.6 via DashScope ou OpenRouter.

Endpoints et fonctionnalités clés

  • POST /v1/chat/completions – Chat completions (streaming supporté)
  • POST /v1/embeddings – Embeddings de texte
  • GET /v1/models – Lister les modèles disponibles
  • preserve_thinking: true – Activer la persistance de l'état de raisonnement
  • Fenêtre de contexte 1M, jusqu'à 65 536 tokens de sortie
  • Appel de fonctions, mode JSON, sorties structurées, vision

Tarifs (DashScope)

  • qwen-plus entrée : 0,40 $ par million de tokens
  • qwen-plus sortie : 2,40 $ par million de tokens
  • Invocation par lots : 50 % du tarif temps réel
  • Environ 12 fois moins cher que Claude Opus 4.6 pour des tâches équivalentes
  • Niveau gratuit OpenRouter : qwen/qwen3.6-plus:free (sans carte bancaire)
  • OpenRouter payant : tarif pass-through + 5,5 % de frais

Modèles disponibles

  • qwen-3.6-plus – Modèle phare, contexte 1M, preserve_thinking
  • qwen-3.6-max – Raisonnement avancé, multimodal
  • qwen-3.6-27b – Open-weight dense, meilleure performance coding
  • qwen-3.6-35b-a3b – Open-weight MoE, rapport qualité-prix
  • Auto-hébergé via vLLM, SGLang, KTransformers

Écosystème Qwen

Un format d'API, plusieurs points d'accès, tarifs leaders du marché

Accède à Qwen 3.6 via DashScope (0,40 $/2,40 $ par M tokens), OpenRouter (niveau gratuit disponible) ou vLLM auto-hébergé – le tout avec le même format d'API compatible OpenAI et le support de preserve_thinking.

DashScope

API directe, 0,40 $/2,40 $ par M tokens

S'inscrire

OpenRouter

API unifiée avec niveau gratuit

Commencer

vLLM auto-hébergé

Ton propre endpoint API, zéro coût par token

Déployer

Python SDK

Bibliothèque Python OpenAI standard, remplacement direct

Installer

Référence API

Documentation complète des endpoints et paramètres

Lire la doc

Tarifs

Tarification à l'usage, lots à -50 %

Voir les tarifs

Pour commencer

Prêt à intégrer Qwen 3.6 ? Commence avec le niveau gratuit, monte en charge à 0,40 $/M tokens

Commence à chatter gratuitement, puis intègre via l'API compatible OpenAI. Remplacement direct avec preserve_thinking pour les workflows agentiques. DashScope à 0,40 $/2,40 $ par million de tokens ou niveau gratuit OpenRouter – sans carte bancaire.