Qwen 3.6 API

OpenAI-compatibele API met preserve_thinking - 12x goedkoper dan Claude Opus 4.6

Toegang tot Qwen 3.6 Plus, Max en open-weight modellen via een OpenAI-compatibele API. DashScope-prijzen beginnen bij $0,40 per miljoen input-tokens en $2,40 per miljoen output-tokens voor qwen-plus, waardoor het ongeveer 12x goedkoper is dan Claude Opus 4.6. Drop-in vervanging voor bestaande OpenAI-integraties met de preserve_thinking-parameter voor het behouden van redeneerstatus in agentlussen. 1M context-venster met tot 65.536 output-tokens. Beschikbaar via DashScope en OpenRouter met een gratis preview-tier.

API-gids

Integreer Qwen 3.6 in je applicaties met minimale codewijzigingen

De Qwen 3.6 API volgt het OpenAI chat completions-formaat, waardoor het een drop-in vervanging is voor bestaande integraties. De preserve_thinking-extensie voegt agentische mogelijkheden toe zonder de compatibiliteit te verbreken. Batch-aanroepen op DashScope kosten 50% van de realtime-prijs.

OpenAI-compatibiliteit

Standaard chat completions-endpoint met berichten, tools en streaming-ondersteuning. Schakel over van OpenAI door alleen de basis-URL en API-sleutel te wijzigen - geen codewijzigingen nodig. Ondersteunt functie-aanroepen, JSON-modus, gestructureerde outputs en visuele/multimodale invoer. Compatibel met Claude Code, OpenClaw, Aider, Continue.dev en elke tool die het OpenAI API-formaat ondersteunt. Het 1M context-venster ondersteunt tot 65.536 output-tokens per verzoek.

DashScope-prijzen

Directe API-toegang via het DashScope-platform van Alibaba Cloud met concurrerende prijzen. qwen-plus: $0,40 per miljoen input-tokens, $2,40 per miljoen output-tokens - ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken. Batch-aanroepen beschikbaar tegen 50% van de realtime-prijs voor niet-latentiegevoelige workloads zoals dataverwerking, evaluatie en bulkgeneratie. Meld je aan voor een API-sleutel op dashscope.aliyuncs.com.

OpenRouter-integratie

Toegang tot Qwen 3.6-modellen via de uniforme API van OpenRouter naast 200+ andere modellen. Gratis preview-tier beschikbaar op qwen/qwen3.6-plus:free zonder creditcard. De betaalde tier gebruikt doorberekende prijzen plus 5,5% toeslag. Eén API-sleutel voor multi-provider toegang met automatische fallback en load balancing. OpenRouter beheert rate limiting en biedt gebruiksanalyses voor al je modelproviders.

preserve_thinking-parameter

Unieke API-extensie die de interne redeneerstatus van het model behoudt tussen iteraties van de agentlus. Stel preserve_thinking: true in je API-verzoek in om redundant redeneren in multi-step workflows te verminderen. Dit verbetert de nauwkeurigheid en vermindert tokenverbruik in agentische pipelines met 15-30% bij typische multi-step taken. Essentieel voor het bouwen van betrouwbare agentlussen met Claude Code, OpenClaw en aangepaste agentische frameworks.

Batch-aanroepen (50% korting)

DashScope biedt batch-aanroepen tegen 50% van de realtime-prijs voor workloads die geen directe respons vereisen. Dien batches van verzoeken in en haal resultaten asynchroon op. Ideaal voor datasetverwerking, modelevaluatie, contentgeneratie-pipelines en elke workflow waar latentie niet kritiek is. Batch-jobs ondersteunen hetzelfde API-formaat als realtime-verzoeken.

1M context-venster

Qwen 3.6 Plus ondersteunt een context-venster van 1M tokens - genoeg om complete codebases, lange onderzoeksartikelen, juridische documenten en uitgebreide multi-turn gesprekken in één keer te verwerken. Gecombineerd met tot 65.536 output-tokens maakt dit het genereren van complete bestanden, gedetailleerde analyses en uitgebreide rapporten zonder afkapping mogelijk. Het context-venster is beschikbaar op zowel DashScope als OpenRouter.

SDK- en framework-ondersteuning

Werkt met elke OpenAI-compatibele SDK: Python (openai), Node.js (openai), Go, Rust, Java en meer. LangChain, LlamaIndex, AutoGen, CrewAI en Semantic Kernel-integraties direct beschikbaar. Geen aangepaste SDK nodig - verander gewoon de basis-URL. De DashScope Python SDK biedt ook native toegang met extra functies zoals batchbeheer en gebruiksmonitoring.

Self-hosted API-optie

Voor teams die volledige datacontrole nodig hebben: deploy Qwen 3.6 open-weight modellen (27B, 35B A3B) met vLLM, SGLang of KTransformers om je eigen OpenAI-compatibel API-endpoint te maken. Zelfde API-formaat als DashScope en OpenRouter, dus je applicatiecode werkt zonder wijzigingen. Nul kosten per token na hardware-investering.

API-referentie

Snel starten met de Qwen 3.6 API

Essentiële endpoints, prijzen, parameters en configuratie om te beginnen met de Qwen 3.6 API via DashScope of OpenRouter.

Belangrijkste endpoints en functies

  • POST /v1/chat/completions - Chat completions (streaming ondersteund)
  • POST /v1/embeddings - Tekstembeddings
  • GET /v1/models - Beschikbare modellen weergeven
  • preserve_thinking: true - Redeneerstatus-persistentie inschakelen
  • 1M context-venster, tot 65.536 output-tokens
  • Functie-aanroepen, JSON-modus, gestructureerde outputs, visie

Prijzen (DashScope)

  • qwen-plus input: $0,40 per miljoen tokens
  • qwen-plus output: $2,40 per miljoen tokens
  • Batch-aanroepen: 50% van de realtime-prijs
  • Ongeveer 12x goedkoper dan Claude Opus 4.6 voor vergelijkbare taken
  • OpenRouter gratis tier: qwen/qwen3.6-plus:free (geen creditcard)
  • OpenRouter betaald: doorberekende prijs + 5,5% toeslag

Beschikbare modellen

  • qwen-3.6-plus - Vlaggenschip, 1M context, preserve_thinking
  • qwen-3.6-max - Geavanceerd redeneren, multimodaal
  • qwen-3.6-27b - Dense open-weight, beste codingprestaties
  • qwen-3.6-35b-a3b - MoE open-weight, kosteneffectief
  • Self-hosted via vLLM, SGLang, KTransformers

Qwen-ecosysteem

Eén API-formaat, meerdere toegangspunten, toonaangevende prijzen

Toegang tot Qwen 3.6 via DashScope ($0,40/$2,40 per M tokens), OpenRouter (gratis tier beschikbaar) of self-hosted vLLM - allemaal met hetzelfde OpenAI-compatibele API-formaat met preserve_thinking-ondersteuning.

DashScope

Directe API, $0,40/$2,40 per M tokens

Aanmelden

OpenRouter

Uniforme API met gratis tier beschikbaar

Aan de slag

Self-hosted vLLM

Draai je eigen API-endpoint, nul kosten per token

Deployen

Python SDK

Standaard OpenAI Python-bibliotheek, drop-in vervanging

Installeren

API-referentie

Volledige endpoint- en parameterdocumentatie

Lees docs

Prijzen

Prijzen op basis van gebruik, batch met 50% korting

Bekijk prijzen

Aan de slag

Klaar om Qwen 3.6 te integreren? Begin met de gratis tier, schaal op met $0,40/M token-prijzen

Begin gratis met chatten en integreer vervolgens via de OpenAI-compatibele API. Drop-in vervanging met preserve_thinking voor agentische workflows. DashScope voor $0,40/$2,40 per miljoen tokens of OpenRouter gratis tier - geen creditcard vereist.