Qwen 3.6 API
OpenAI-kompatible API mit preserve_thinking – 12-mal günstiger als Claude Opus 4.6
Greife auf Qwen 3.6 Plus, Max und Open-Weight-Modelle über eine OpenAI-kompatible API zu. DashScope-Preise beginnen bei 0,40 $ pro Million Input-Token und 2,40 $ pro Million Output-Token für qwen-plus – rund 12-mal günstiger als Claude Opus 4.6. Drop-in-Ersatz für bestehende OpenAI-Integrationen mit dem preserve_thinking-Parameter zur Beibehaltung des Reasoning-Zustands über Agent-Schleifen hinweg. 1M-Token-Kontextfenster mit bis zu 65.536 Ausgabe-Token. Verfügbar über DashScope direkt und OpenRouter mit kostenloser Vorschaustufe.
API-Leitfaden
Integriere Qwen 3.6 mit minimalen Code-Änderungen in deine Anwendungen
Die Qwen-3.6-API folgt dem OpenAI-Chat-Completions-Format und ist ein Drop-in-Ersatz für bestehende Integrationen. Die preserve_thinking-Erweiterung fügt agentische Fähigkeiten hinzu, ohne die Kompatibilität zu beeinträchtigen. Batch-Verarbeitung auf DashScope läuft zu 50 % des Echtzeit-Preises.
OpenAI-Kompatibilität
Standard-Chat-Completions-Endpunkt mit Messages, Tools und Streaming-Unterstützung. Wechsle von OpenAI, indem du einfach die Base-URL und den API-Key änderst – keine Code-Änderungen nötig. Unterstützt Function Calling, JSON-Modus, strukturierte Ausgaben und Vision/multimodale Eingaben. Kompatibel mit Claude Code, OpenClaw, Aider, Continue.dev und jedem Tool, das das OpenAI-API-Format unterstützt. Das 1M-Kontextfenster unterstützt bis zu 65.536 Ausgabe-Token pro Anfrage.
DashScope-Preise
Direkter API-Zugang über Alibaba Clouds DashScope-Plattform mit wettbewerbsfähigen Preisen. qwen-plus: 0,40 $ pro Million Input-Token, 2,40 $ pro Million Output-Token – rund 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben. Batch-Verarbeitung zu 50 % des Echtzeit-Preises für nicht latenzempfindliche Workloads wie Datenverarbeitung, Evaluierung und Massengenerierung. Registriere dich für einen API-Key auf dashscope.aliyuncs.com.
OpenRouter-Integration
Greife auf Qwen-3.6-Modelle über OpenRouters einheitliche API neben über 200 weiteren Modellen zu. Kostenlose Vorschaustufe unter qwen/qwen3.6-plus:free ohne Kreditkarte. Die kostenpflichtige Stufe nutzt Durchleitungspreise plus 5,5 % Gebühr. Ein einziger API-Key für Multi-Provider-Zugang mit automatischem Fallback und Lastverteilung. OpenRouter übernimmt Rate-Limiting und bietet Nutzungsanalysen über alle Modellanbieter.
preserve_thinking-Parameter
Einzigartige API-Erweiterung, die den internen Reasoning-Zustand des Modells über Agent-Loop-Iterationen hinweg beibehält. Setze preserve_thinking: true in deiner API-Anfrage, um redundantes Re-Reasoning in mehrstufigen Workflows zu reduzieren. Dies verbessert die Genauigkeit und reduziert den Token-Verbrauch in agentischen Pipelines um 15–30 % bei typischen mehrstufigen Aufgaben. Unverzichtbar für zuverlässige Agent-Loops mit Claude Code, OpenClaw und eigenen agentischen Frameworks.
Batch-Verarbeitung (50 % Rabatt)
DashScope bietet Batch-Verarbeitung zu 50 % des Echtzeit-Preises für Workloads, die keine sofortige Antwort erfordern. Reiche Anfragen-Batches ein und rufe Ergebnisse asynchron ab. Ideal für Datensatzverarbeitung, Modellevaluierung, Content-Generierungs-Pipelines und jeden Workflow, bei dem Latenz nicht kritisch ist. Batch-Jobs unterstützen dasselbe API-Format wie Echtzeit-Anfragen.
1M-Kontextfenster
Qwen 3.6 Plus unterstützt ein 1M-Token-Kontextfenster – genug, um ganze Codebasen, lange Forschungsarbeiten, Rechtsdokumente und ausgedehnte Mehrrunden-Gespräche in einem Durchgang zu verarbeiten. Kombiniert mit bis zu 65.536 Ausgabe-Token ermöglicht dies die Generierung vollständiger Dateien, detaillierter Analysen und umfassender Berichte ohne Kürzung. Das Kontextfenster ist sowohl auf DashScope als auch auf OpenRouter verfügbar.
SDK- und Framework-Unterstützung
Funktioniert mit jedem OpenAI-kompatiblen SDK: Python (openai), Node.js (openai), Go, Rust, Java und mehr. LangChain-, LlamaIndex-, AutoGen-, CrewAI- und Semantic-Kernel-Integrationen sind sofort einsatzbereit. Kein eigenes SDK nötig – ändere einfach die Base-URL. Das DashScope Python SDK bietet zusätzlich nativen Zugang mit erweiterten Funktionen wie Batch-Management und Nutzungsverfolgung.
Selbst gehostete API-Option
Für Teams, die volle Datenkontrolle benötigen: Stelle Qwen-3.6-Open-Weight-Modelle (27B, 35B A3B) mit vLLM, SGLang oder KTransformers bereit und erstelle deinen eigenen OpenAI-kompatiblen API-Endpunkt. Gleiches API-Format wie DashScope und OpenRouter, sodass dein Anwendungscode ohne Änderungen funktioniert. Keine Token-Kosten nach der Hardware-Investition.
API-Referenz
Schnellstart mit der Qwen-3.6-API
Wichtige Endpunkte, Preise, Parameter und Konfiguration für den Einstieg mit der Qwen-3.6-API über DashScope oder OpenRouter.
Wichtige Endpunkte und Funktionen
- POST /v1/chat/completions – Chat-Completions (Streaming unterstützt)
- POST /v1/embeddings – Text-Embeddings
- GET /v1/models – Verfügbare Modelle auflisten
- preserve_thinking: true – Reasoning-Zustand beibehalten
- 1M-Kontextfenster, bis zu 65.536 Ausgabe-Token
- Function Calling, JSON-Modus, strukturierte Ausgaben, Vision
Preise (DashScope)
- qwen-plus Input: 0,40 $ pro Million Token
- qwen-plus Output: 2,40 $ pro Million Token
- Batch-Verarbeitung: 50 % des Echtzeit-Preises
- Ca. 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben
- OpenRouter kostenlose Stufe: qwen/qwen3.6-plus:free (keine Kreditkarte)
- OpenRouter kostenpflichtig: Durchleitungspreis + 5,5 % Gebühr
Verfügbare Modelle
- qwen-3.6-plus – Flaggschiff, 1M Kontext, preserve_thinking
- qwen-3.6-max – Erweitertes Reasoning, multimodal
- qwen-3.6-27b – Dichtes Open-Weight-Modell, beste Coding-Leistung
- qwen-3.6-35b-a3b – MoE Open-Weight-Modell, kosteneffizient
- Selbst gehostet über vLLM, SGLang, KTransformers
Erste Schritte
Beginne in Minuten mit der Qwen-3.6-API zu entwickeln
Hol dir deinen API-Key und sende deine erste Anfrage. Das OpenAI-kompatible Format bedeutet, dass du mit vertrauten Tools und SDKs starten kannst.
Registriere dich und erhalte deinen API-Key von Alibaba Cloud DashScope
Zugriff auf Qwen 3.6 über OpenRouter – kostenlose Stufe verfügbar
Verwende das Standard-OpenAI-Python-SDK mit Qwen 3.6
Integriere Qwen 3.6 in Node.js-Anwendungen
Batch-Jobs zu 50 % Preis für Massenverarbeitung einreichen
Kosten für deinen Workload im Vergleich zu Claude, GPT-4o, Gemini schätzen
Erweiterte Nutzung
Agentische Workflows mit preserve_thinking und Tool-Calling erstellen
Nutze den preserve_thinking-Parameter, Function Calling und 1M Kontext für komplexe mehrstufige Agent-Pipelines und Produktionsanwendungen.
LangChain-, AutoGen-, CrewAI- und Semantic-Kernel-Integration
Function Calling, MCP-Protokoll und strukturierte Tool-Nutzung
Server-Sent Events für Echtzeit-Antworten und Fortschritt
Qwen 3.6 als Backend für Claude Code über die API nutzen
Mit vLLM oder SGLang bereitstellen für null Token-Kosten
Qwen-Ökosystem
Ein API-Format, mehrere Zugangspunkte, branchenführende Preise
Greife auf Qwen 3.6 über DashScope (0,40 $/2,40 $ pro M Token), OpenRouter (kostenlose Stufe verfügbar) oder selbst gehostetes vLLM zu – alles im gleichen OpenAI-kompatiblen API-Format mit preserve_thinking-Unterstützung.
Erste Schritte
Bereit, Qwen 3.6 zu integrieren? Starte mit der kostenlosen Stufe, skaliere mit 0,40 $/M Token
Chatte kostenlos, dann integriere über die OpenAI-kompatible API. Drop-in-Ersatz mit preserve_thinking für agentische Workflows. DashScope ab 0,40 $/2,40 $ pro Million Token oder OpenRouter kostenlose Stufe – keine Kreditkarte nötig.