Qwen 3.6 API

OpenAI-compatibele API met preserve_thinking - 12x goedkoper dan Claude Opus 4.6

Toegang tot Qwen 3.6 Plus, Max en open-weight modellen via een OpenAI-compatibele API. DashScope-prijzen beginnen bij $0,40 per miljoen input-tokens en $2,40 per miljoen output-tokens voor qwen-plus, waardoor het ongeveer 12x goedkoper is dan Claude Opus 4.6. Drop-in vervanging voor bestaande OpenAI-integraties met de preserve_thinking-parameter voor het behouden van redeneerstatus in agentlussen. 1M context-venster met tot 65.536 output-tokens. Beschikbaar via DashScope en OpenRouter met een gratis preview-tier.

Start met chatten Bekijk API-docs

API-gids

Integreer Qwen 3.6 in je applicaties met minimale codewijzigingen

De Qwen 3.6 API volgt het OpenAI chat completions-formaat, waardoor het een drop-in vervanging is voor bestaande integraties. De preserve_thinking-extensie voegt agentische mogelijkheden toe zonder de compatibiliteit te verbreken. Batch-aanroepen op DashScope kosten 50% van de realtime-prijs.

OpenAI-compatibiliteit

Standaard chat completions-endpoint met berichten, tools en streaming-ondersteuning. Schakel over van OpenAI door alleen de basis-URL en API-sleutel te wijzigen - geen codewijzigingen nodig. Ondersteunt functie-aanroepen, JSON-modus, gestructureerde outputs en visuele/multimodale invoer. Compatibel met Claude Code, OpenClaw, Aider, Continue.dev en elke tool die het OpenAI API-formaat ondersteunt. Het 1M context-venster ondersteunt tot 65.536 output-tokens per verzoek.

DashScope-prijzen

Directe API-toegang via het DashScope-platform van Alibaba Cloud met concurrerende prijzen. qwen-plus: $0,40 per miljoen input-tokens, $2,40 per miljoen output-tokens - ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken. Batch-aanroepen beschikbaar tegen 50% van de realtime-prijs voor niet-latentiegevoelige workloads zoals dataverwerking, evaluatie en bulkgeneratie. Meld je aan voor een API-sleutel op dashscope.aliyuncs.com.

OpenRouter-integratie

Toegang tot Qwen 3.6-modellen via de uniforme API van OpenRouter naast 200+ andere modellen. Gratis preview-tier beschikbaar op qwen/qwen3.6-plus:free zonder creditcard. De betaalde tier gebruikt doorberekende prijzen plus 5,5% toeslag. Eén API-sleutel voor multi-provider toegang met automatische fallback en load balancing. OpenRouter beheert rate limiting en biedt gebruiksanalyses voor al je modelproviders.

preserve_thinking-parameter

Unieke API-extensie die de interne redeneerstatus van het model behoudt tussen iteraties van de agentlus. Stel preserve_thinking: true in je API-verzoek in om redundant redeneren in multi-step workflows te verminderen. Dit verbetert de nauwkeurigheid en vermindert tokenverbruik in agentische pipelines met 15-30% bij typische multi-step taken. Essentieel voor het bouwen van betrouwbare agentlussen met Claude Code, OpenClaw en aangepaste agentische frameworks.

Batch-aanroepen (50% korting)

DashScope biedt batch-aanroepen tegen 50% van de realtime-prijs voor workloads die geen directe respons vereisen. Dien batches van verzoeken in en haal resultaten asynchroon op. Ideaal voor datasetverwerking, modelevaluatie, contentgeneratie-pipelines en elke workflow waar latentie niet kritiek is. Batch-jobs ondersteunen hetzelfde API-formaat als realtime-verzoeken.

1M context-venster

Qwen 3.6 Plus ondersteunt een context-venster van 1M tokens - genoeg om complete codebases, lange onderzoeksartikelen, juridische documenten en uitgebreide multi-turn gesprekken in één keer te verwerken. Gecombineerd met tot 65.536 output-tokens maakt dit het genereren van complete bestanden, gedetailleerde analyses en uitgebreide rapporten zonder afkapping mogelijk. Het context-venster is beschikbaar op zowel DashScope als OpenRouter.

SDK- en framework-ondersteuning

Werkt met elke OpenAI-compatibele SDK: Python (openai), Node.js (openai), Go, Rust, Java en meer. LangChain, LlamaIndex, AutoGen, CrewAI en Semantic Kernel-integraties direct beschikbaar. Geen aangepaste SDK nodig - verander gewoon de basis-URL. De DashScope Python SDK biedt ook native toegang met extra functies zoals batchbeheer en gebruiksmonitoring.

Self-hosted API-optie

Voor teams die volledige datacontrole nodig hebben: deploy Qwen 3.6 open-weight modellen (27B, 35B A3B) met vLLM, SGLang of KTransformers om je eigen OpenAI-compatibel API-endpoint te maken. Zelfde API-formaat als DashScope en OpenRouter, dus je applicatiecode werkt zonder wijzigingen. Nul kosten per token na hardware-investering.

API-referentie

Snel starten met de Qwen 3.6 API

Essentiële endpoints, prijzen, parameters en configuratie om te beginnen met de Qwen 3.6 API via DashScope of OpenRouter.

Belangrijkste endpoints en functies

POST /v1/chat/completions - Chat completions (streaming ondersteund)
POST /v1/embeddings - Tekstembeddings
GET /v1/models - Beschikbare modellen weergeven
preserve_thinking: true - Redeneerstatus-persistentie inschakelen
1M context-venster, tot 65.536 output-tokens
Functie-aanroepen, JSON-modus, gestructureerde outputs, visie

Prijzen (DashScope)

qwen-plus input: $0,40 per miljoen tokens
qwen-plus output: $2,40 per miljoen tokens
Batch-aanroepen: 50% van de realtime-prijs
Ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken
OpenRouter gratis tier: qwen/qwen3.6-plus:free (geen creditcard)
OpenRouter betaald: doorberekende prijs + 5,5% toeslag

Beschikbare modellen

qwen-3.6-plus - Vlaggenschip, 1M context, preserve_thinking
qwen-3.6-max - Geavanceerd redeneren, multimodaal
qwen-3.6-27b - Dense open-weight, beste codingprestaties
qwen-3.6-35b-a3b - MoE open-weight, kosteneffectief
Self-hosted via vLLM, SGLang, KTransformers

Start met chatten API-documentatie

Aan de slag

Begin binnen minuten met bouwen met de Qwen 3.6 API

Haal je API-sleutel op en doe je eerste verzoek. Het OpenAI-compatibele formaat betekent dat je kunt starten met vertrouwde tools en SDK's.

DashScope-snelstart

Meld je aan en haal je API-sleutel op bij Alibaba Cloud DashScope

OpenRouter-setup

Toegang tot Qwen 3.6 via OpenRouter - gratis tier beschikbaar

Python SDK-gids

Gebruik de standaard OpenAI Python SDK met Qwen 3.6

Node.js SDK-gids

Integreer Qwen 3.6 in Node.js-applicaties

Gids batch-aanroepen

Dien batch-jobs in tegen 50% prijs voor bulkworkloads

tag

Prijscalculator

Schat kosten voor jouw workload vs Claude, GPT-4o, Gemini

Geavanceerd gebruik

Bouw agentische workflows met preserve_thinking en functie-aanroepen

Benut de preserve_thinking-parameter, functie-aanroepen en 1M context voor complexe multi-step agentpipelines en productieapplicaties.

Agentframeworks

Integratie met LangChain, AutoGen, CrewAI en Semantic Kernel

Gids functie-aanroepen

Functie-aanroepen, MCP-protocol en gestructureerd toolgebruik

Streaming-gids

Server-sent events voor realtime-respons en voortgang

Claude Code-integratie

Gebruik Qwen 3.6 als backend voor Claude Code via API

Self-hosted deployment

Deploy met vLLM of SGLang voor nul kosten per token

Qwen-ecosysteem

Eén API-formaat, meerdere toegangspunten, toonaangevende prijzen

Toegang tot Qwen 3.6 via DashScope ($0,40/$2,40 per M tokens), OpenRouter (gratis tier beschikbaar) of self-hosted vLLM - allemaal met hetzelfde OpenAI-compatibele API-formaat met preserve_thinking-ondersteuning.

Ontdek alle modellen API-documentatie

DashScope

Directe API, $0,40/$2,40 per M tokens

Aanmelden

OpenRouter

Uniforme API met gratis tier beschikbaar

Aan de slag

Self-hosted vLLM

Draai je eigen API-endpoint, nul kosten per token

Deployen

Python SDK

Standaard OpenAI Python-bibliotheek, drop-in vervanging

Installeren

API-referentie

Volledige endpoint- en parameterdocumentatie

Lees docs

Prijzen

Prijzen op basis van gebruik, batch met 50% korting

Bekijk prijzen

Aan de slag

Klaar om Qwen 3.6 te integreren? Begin met de gratis tier, schaal op met $0,40/M token-prijzen

Begin gratis met chatten en integreer vervolgens via de OpenAI-compatibele API. Drop-in vervanging met preserve_thinking voor agentische workflows. DashScope voor $0,40/$2,40 per miljoen tokens of OpenRouter gratis tier - geen creditcard vereist.

Start met chatten API-documentatie