Qwen 3.6 API
OpenAI-compatibele API met preserve_thinking - 12x goedkoper dan Claude Opus 4.6
Toegang tot Qwen 3.6 Plus, Max en open-weight modellen via een OpenAI-compatibele API. DashScope-prijzen beginnen bij $0,40 per miljoen input-tokens en $2,40 per miljoen output-tokens voor qwen-plus, waardoor het ongeveer 12x goedkoper is dan Claude Opus 4.6. Drop-in vervanging voor bestaande OpenAI-integraties met de preserve_thinking-parameter voor het behouden van redeneerstatus in agentlussen. 1M context-venster met tot 65.536 output-tokens. Beschikbaar via DashScope en OpenRouter met een gratis preview-tier.
API-gids
Integreer Qwen 3.6 in je applicaties met minimale codewijzigingen
De Qwen 3.6 API volgt het OpenAI chat completions-formaat, waardoor het een drop-in vervanging is voor bestaande integraties. De preserve_thinking-extensie voegt agentische mogelijkheden toe zonder de compatibiliteit te verbreken. Batch-aanroepen op DashScope kosten 50% van de realtime-prijs.
OpenAI-compatibiliteit
Standaard chat completions-endpoint met berichten, tools en streaming-ondersteuning. Schakel over van OpenAI door alleen de basis-URL en API-sleutel te wijzigen - geen codewijzigingen nodig. Ondersteunt functie-aanroepen, JSON-modus, gestructureerde outputs en visuele/multimodale invoer. Compatibel met Claude Code, OpenClaw, Aider, Continue.dev en elke tool die het OpenAI API-formaat ondersteunt. Het 1M context-venster ondersteunt tot 65.536 output-tokens per verzoek.
DashScope-prijzen
Directe API-toegang via het DashScope-platform van Alibaba Cloud met concurrerende prijzen. qwen-plus: $0,40 per miljoen input-tokens, $2,40 per miljoen output-tokens - ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken. Batch-aanroepen beschikbaar tegen 50% van de realtime-prijs voor niet-latentiegevoelige workloads zoals dataverwerking, evaluatie en bulkgeneratie. Meld je aan voor een API-sleutel op dashscope.aliyuncs.com.
OpenRouter-integratie
Toegang tot Qwen 3.6-modellen via de uniforme API van OpenRouter naast 200+ andere modellen. Gratis preview-tier beschikbaar op qwen/qwen3.6-plus:free zonder creditcard. De betaalde tier gebruikt doorberekende prijzen plus 5,5% toeslag. Eén API-sleutel voor multi-provider toegang met automatische fallback en load balancing. OpenRouter beheert rate limiting en biedt gebruiksanalyses voor al je modelproviders.
preserve_thinking-parameter
Unieke API-extensie die de interne redeneerstatus van het model behoudt tussen iteraties van de agentlus. Stel preserve_thinking: true in je API-verzoek in om redundant redeneren in multi-step workflows te verminderen. Dit verbetert de nauwkeurigheid en vermindert tokenverbruik in agentische pipelines met 15-30% bij typische multi-step taken. Essentieel voor het bouwen van betrouwbare agentlussen met Claude Code, OpenClaw en aangepaste agentische frameworks.
Batch-aanroepen (50% korting)
DashScope biedt batch-aanroepen tegen 50% van de realtime-prijs voor workloads die geen directe respons vereisen. Dien batches van verzoeken in en haal resultaten asynchroon op. Ideaal voor datasetverwerking, modelevaluatie, contentgeneratie-pipelines en elke workflow waar latentie niet kritiek is. Batch-jobs ondersteunen hetzelfde API-formaat als realtime-verzoeken.
1M context-venster
Qwen 3.6 Plus ondersteunt een context-venster van 1M tokens - genoeg om complete codebases, lange onderzoeksartikelen, juridische documenten en uitgebreide multi-turn gesprekken in één keer te verwerken. Gecombineerd met tot 65.536 output-tokens maakt dit het genereren van complete bestanden, gedetailleerde analyses en uitgebreide rapporten zonder afkapping mogelijk. Het context-venster is beschikbaar op zowel DashScope als OpenRouter.
SDK- en framework-ondersteuning
Werkt met elke OpenAI-compatibele SDK: Python (openai), Node.js (openai), Go, Rust, Java en meer. LangChain, LlamaIndex, AutoGen, CrewAI en Semantic Kernel-integraties direct beschikbaar. Geen aangepaste SDK nodig - verander gewoon de basis-URL. De DashScope Python SDK biedt ook native toegang met extra functies zoals batchbeheer en gebruiksmonitoring.
Self-hosted API-optie
Voor teams die volledige datacontrole nodig hebben: deploy Qwen 3.6 open-weight modellen (27B, 35B A3B) met vLLM, SGLang of KTransformers om je eigen OpenAI-compatibel API-endpoint te maken. Zelfde API-formaat als DashScope en OpenRouter, dus je applicatiecode werkt zonder wijzigingen. Nul kosten per token na hardware-investering.
API-referentie
Snel starten met de Qwen 3.6 API
Essentiële endpoints, prijzen, parameters en configuratie om te beginnen met de Qwen 3.6 API via DashScope of OpenRouter.
Belangrijkste endpoints en functies
- POST /v1/chat/completions - Chat completions (streaming ondersteund)
- POST /v1/embeddings - Tekstembeddings
- GET /v1/models - Beschikbare modellen weergeven
- preserve_thinking: true - Redeneerstatus-persistentie inschakelen
- 1M context-venster, tot 65.536 output-tokens
- Functie-aanroepen, JSON-modus, gestructureerde outputs, visie
Prijzen (DashScope)
- qwen-plus input: $0,40 per miljoen tokens
- qwen-plus output: $2,40 per miljoen tokens
- Batch-aanroepen: 50% van de realtime-prijs
- Ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken
- OpenRouter gratis tier: qwen/qwen3.6-plus:free (geen creditcard)
- OpenRouter betaald: doorberekende prijs + 5,5% toeslag
Beschikbare modellen
- qwen-3.6-plus - Vlaggenschip, 1M context, preserve_thinking
- qwen-3.6-max - Geavanceerd redeneren, multimodaal
- qwen-3.6-27b - Dense open-weight, beste codingprestaties
- qwen-3.6-35b-a3b - MoE open-weight, kosteneffectief
- Self-hosted via vLLM, SGLang, KTransformers
Aan de slag
Begin binnen minuten met bouwen met de Qwen 3.6 API
Haal je API-sleutel op en doe je eerste verzoek. Het OpenAI-compatibele formaat betekent dat je kunt starten met vertrouwde tools en SDK's.
Meld je aan en haal je API-sleutel op bij Alibaba Cloud DashScope
Toegang tot Qwen 3.6 via OpenRouter - gratis tier beschikbaar
Gebruik de standaard OpenAI Python SDK met Qwen 3.6
Integreer Qwen 3.6 in Node.js-applicaties
Dien batch-jobs in tegen 50% prijs voor bulkworkloads
Schat kosten voor jouw workload vs Claude, GPT-4o, Gemini
Geavanceerd gebruik
Bouw agentische workflows met preserve_thinking en functie-aanroepen
Benut de preserve_thinking-parameter, functie-aanroepen en 1M context voor complexe multi-step agentpipelines en productieapplicaties.
Integratie met LangChain, AutoGen, CrewAI en Semantic Kernel
Functie-aanroepen, MCP-protocol en gestructureerd toolgebruik
Server-sent events voor realtime-respons en voortgang
Gebruik Qwen 3.6 als backend voor Claude Code via API
Deploy met vLLM of SGLang voor nul kosten per token
Qwen-ecosysteem
Eén API-formaat, meerdere toegangspunten, toonaangevende prijzen
Toegang tot Qwen 3.6 via DashScope ($0,40/$2,40 per M tokens), OpenRouter (gratis tier beschikbaar) of self-hosted vLLM - allemaal met hetzelfde OpenAI-compatibele API-formaat met preserve_thinking-ondersteuning.
Aan de slag
Klaar om Qwen 3.6 te integreren? Begin met de gratis tier, schaal op met $0,40/M token-prijzen
Begin gratis met chatten en integreer vervolgens via de OpenAI-compatibele API. Drop-in vervanging met preserve_thinking voor agentische workflows. DashScope voor $0,40/$2,40 per miljoen tokens of OpenRouter gratis tier - geen creditcard vereist.