Qwen 3.6 API

OpenAI-kompatible API mit preserve_thinking – 12-mal günstiger als Claude Opus 4.6

Greife auf Qwen 3.6 Plus, Max und Open-Weight-Modelle über eine OpenAI-kompatible API zu. DashScope-Preise beginnen bei 0,40 $ pro Million Input-Token und 2,40 $ pro Million Output-Token für qwen-plus – rund 12-mal günstiger als Claude Opus 4.6. Drop-in-Ersatz für bestehende OpenAI-Integrationen mit dem preserve_thinking-Parameter zur Beibehaltung des Reasoning-Zustands über Agent-Schleifen hinweg. 1M-Token-Kontextfenster mit bis zu 65.536 Ausgabe-Token. Verfügbar über DashScope direkt und OpenRouter mit kostenloser Vorschaustufe.

Jetzt chatten API-Dokumentation

API-Leitfaden

Integriere Qwen 3.6 mit minimalen Code-Änderungen in deine Anwendungen

Die Qwen-3.6-API folgt dem OpenAI-Chat-Completions-Format und ist ein Drop-in-Ersatz für bestehende Integrationen. Die preserve_thinking-Erweiterung fügt agentische Fähigkeiten hinzu, ohne die Kompatibilität zu beeinträchtigen. Batch-Verarbeitung auf DashScope läuft zu 50 % des Echtzeit-Preises.

OpenAI-Kompatibilität

Standard-Chat-Completions-Endpunkt mit Messages, Tools und Streaming-Unterstützung. Wechsle von OpenAI, indem du einfach die Base-URL und den API-Key änderst – keine Code-Änderungen nötig. Unterstützt Function Calling, JSON-Modus, strukturierte Ausgaben und Vision/multimodale Eingaben. Kompatibel mit Claude Code, OpenClaw, Aider, Continue.dev und jedem Tool, das das OpenAI-API-Format unterstützt. Das 1M-Kontextfenster unterstützt bis zu 65.536 Ausgabe-Token pro Anfrage.

DashScope-Preise

Direkter API-Zugang über Alibaba Clouds DashScope-Plattform mit wettbewerbsfähigen Preisen. qwen-plus: 0,40 $ pro Million Input-Token, 2,40 $ pro Million Output-Token – rund 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben. Batch-Verarbeitung zu 50 % des Echtzeit-Preises für nicht latenzempfindliche Workloads wie Datenverarbeitung, Evaluierung und Massengenerierung. Registriere dich für einen API-Key auf dashscope.aliyuncs.com.

OpenRouter-Integration

Greife auf Qwen-3.6-Modelle über OpenRouters einheitliche API neben über 200 weiteren Modellen zu. Kostenlose Vorschaustufe unter qwen/qwen3.6-plus:free ohne Kreditkarte. Die kostenpflichtige Stufe nutzt Durchleitungspreise plus 5,5 % Gebühr. Ein einziger API-Key für Multi-Provider-Zugang mit automatischem Fallback und Lastverteilung. OpenRouter übernimmt Rate-Limiting und bietet Nutzungsanalysen über alle Modellanbieter.

preserve_thinking-Parameter

Einzigartige API-Erweiterung, die den internen Reasoning-Zustand des Modells über Agent-Loop-Iterationen hinweg beibehält. Setze preserve_thinking: true in deiner API-Anfrage, um redundantes Re-Reasoning in mehrstufigen Workflows zu reduzieren. Dies verbessert die Genauigkeit und reduziert den Token-Verbrauch in agentischen Pipelines um 15–30 % bei typischen mehrstufigen Aufgaben. Unverzichtbar für zuverlässige Agent-Loops mit Claude Code, OpenClaw und eigenen agentischen Frameworks.

Batch-Verarbeitung (50 % Rabatt)

DashScope bietet Batch-Verarbeitung zu 50 % des Echtzeit-Preises für Workloads, die keine sofortige Antwort erfordern. Reiche Anfragen-Batches ein und rufe Ergebnisse asynchron ab. Ideal für Datensatzverarbeitung, Modellevaluierung, Content-Generierungs-Pipelines und jeden Workflow, bei dem Latenz nicht kritisch ist. Batch-Jobs unterstützen dasselbe API-Format wie Echtzeit-Anfragen.

1M-Kontextfenster

Qwen 3.6 Plus unterstützt ein 1M-Token-Kontextfenster – genug, um ganze Codebasen, lange Forschungsarbeiten, Rechtsdokumente und ausgedehnte Mehrrunden-Gespräche in einem Durchgang zu verarbeiten. Kombiniert mit bis zu 65.536 Ausgabe-Token ermöglicht dies die Generierung vollständiger Dateien, detaillierter Analysen und umfassender Berichte ohne Kürzung. Das Kontextfenster ist sowohl auf DashScope als auch auf OpenRouter verfügbar.

SDK- und Framework-Unterstützung

Funktioniert mit jedem OpenAI-kompatiblen SDK: Python (openai), Node.js (openai), Go, Rust, Java und mehr. LangChain-, LlamaIndex-, AutoGen-, CrewAI- und Semantic-Kernel-Integrationen sind sofort einsatzbereit. Kein eigenes SDK nötig – ändere einfach die Base-URL. Das DashScope Python SDK bietet zusätzlich nativen Zugang mit erweiterten Funktionen wie Batch-Management und Nutzungsverfolgung.

Selbst gehostete API-Option

Für Teams, die volle Datenkontrolle benötigen: Stelle Qwen-3.6-Open-Weight-Modelle (27B, 35B A3B) mit vLLM, SGLang oder KTransformers bereit und erstelle deinen eigenen OpenAI-kompatiblen API-Endpunkt. Gleiches API-Format wie DashScope und OpenRouter, sodass dein Anwendungscode ohne Änderungen funktioniert. Keine Token-Kosten nach der Hardware-Investition.

API-Referenz

Schnellstart mit der Qwen-3.6-API

Wichtige Endpunkte, Preise, Parameter und Konfiguration für den Einstieg mit der Qwen-3.6-API über DashScope oder OpenRouter.

Wichtige Endpunkte und Funktionen

POST /v1/chat/completions – Chat-Completions (Streaming unterstützt)
POST /v1/embeddings – Text-Embeddings
GET /v1/models – Verfügbare Modelle auflisten
preserve_thinking: true – Reasoning-Zustand beibehalten
1M-Kontextfenster, bis zu 65.536 Ausgabe-Token
Function Calling, JSON-Modus, strukturierte Ausgaben, Vision

Preise (DashScope)

qwen-plus Input: 0,40 $ pro Million Token
qwen-plus Output: 2,40 $ pro Million Token
Batch-Verarbeitung: 50 % des Echtzeit-Preises
Ca. 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben
OpenRouter kostenlose Stufe: qwen/qwen3.6-plus:free (keine Kreditkarte)
OpenRouter kostenpflichtig: Durchleitungspreis + 5,5 % Gebühr

Verfügbare Modelle

qwen-3.6-plus – Flaggschiff, 1M Kontext, preserve_thinking
qwen-3.6-max – Erweitertes Reasoning, multimodal
qwen-3.6-27b – Dichtes Open-Weight-Modell, beste Coding-Leistung
qwen-3.6-35b-a3b – MoE Open-Weight-Modell, kosteneffizient
Selbst gehostet über vLLM, SGLang, KTransformers

Jetzt chatten API-Dokumentation

Erste Schritte

Beginne in Minuten mit der Qwen-3.6-API zu entwickeln

Hol dir deinen API-Key und sende deine erste Anfrage. Das OpenAI-kompatible Format bedeutet, dass du mit vertrauten Tools und SDKs starten kannst.

DashScope-Schnellstart

Registriere dich und erhalte deinen API-Key von Alibaba Cloud DashScope

OpenRouter-Einrichtung

Zugriff auf Qwen 3.6 über OpenRouter – kostenlose Stufe verfügbar

Python-SDK-Anleitung

Verwende das Standard-OpenAI-Python-SDK mit Qwen 3.6

Node.js-SDK-Anleitung

Integriere Qwen 3.6 in Node.js-Anwendungen

Batch-Verarbeitungs-Anleitung

Batch-Jobs zu 50 % Preis für Massenverarbeitung einreichen

tag

Preisrechner

Kosten für deinen Workload im Vergleich zu Claude, GPT-4o, Gemini schätzen

Erweiterte Nutzung

Agentische Workflows mit preserve_thinking und Tool-Calling erstellen

Nutze den preserve_thinking-Parameter, Function Calling und 1M Kontext für komplexe mehrstufige Agent-Pipelines und Produktionsanwendungen.

Agent-Frameworks

LangChain-, AutoGen-, CrewAI- und Semantic-Kernel-Integration

Tool-Calling-Anleitung

Function Calling, MCP-Protokoll und strukturierte Tool-Nutzung

Streaming-Anleitung

Server-Sent Events für Echtzeit-Antworten und Fortschritt

Claude-Code-Integration

Qwen 3.6 als Backend für Claude Code über die API nutzen

Selbst gehostetes Deployment

Mit vLLM oder SGLang bereitstellen für null Token-Kosten

Qwen-Ökosystem

Ein API-Format, mehrere Zugangspunkte, branchenführende Preise

Greife auf Qwen 3.6 über DashScope (0,40 $/2,40 $ pro M Token), OpenRouter (kostenlose Stufe verfügbar) oder selbst gehostetes vLLM zu – alles im gleichen OpenAI-kompatiblen API-Format mit preserve_thinking-Unterstützung.

Alle Modelle entdecken API-Dokumentation

DashScope

Direkte API, 0,40 $/2,40 $ pro M Token

Registrieren

OpenRouter

Einheitliche API mit kostenloser Stufe

Loslegen

Selbst gehostetes vLLM

Eigenen API-Endpunkt betreiben, null Token-Kosten

Bereitstellen

Python SDK

Standard-OpenAI-Python-Bibliothek, Drop-in-Ersatz

Installieren

API-Referenz

Vollständige Endpunkt- und Parameter-Dokumentation

Doku lesen

Preise

Nutzungsbasierte Preise, Batch mit 50 % Rabatt

Preise ansehen

Erste Schritte

Bereit, Qwen 3.6 zu integrieren? Starte mit der kostenlosen Stufe, skaliere mit 0,40 $/M Token

Chatte kostenlos, dann integriere über die OpenAI-kompatible API. Drop-in-Ersatz mit preserve_thinking für agentische Workflows. DashScope ab 0,40 $/2,40 $ pro Million Token oder OpenRouter kostenlose Stufe – keine Kreditkarte nötig.

Jetzt chatten API-Dokumentation