Qwen 3.6 API

OpenAI-kompatible API mit preserve_thinking – 12-mal günstiger als Claude Opus 4.6

Greife auf Qwen 3.6 Plus, Max und Open-Weight-Modelle über eine OpenAI-kompatible API zu. DashScope-Preise beginnen bei 0,40 $ pro Million Input-Token und 2,40 $ pro Million Output-Token für qwen-plus – rund 12-mal günstiger als Claude Opus 4.6. Drop-in-Ersatz für bestehende OpenAI-Integrationen mit dem preserve_thinking-Parameter zur Beibehaltung des Reasoning-Zustands über Agent-Schleifen hinweg. 1M-Token-Kontextfenster mit bis zu 65.536 Ausgabe-Token. Verfügbar über DashScope direkt und OpenRouter mit kostenloser Vorschaustufe.

API-Leitfaden

Integriere Qwen 3.6 mit minimalen Code-Änderungen in deine Anwendungen

Die Qwen-3.6-API folgt dem OpenAI-Chat-Completions-Format und ist ein Drop-in-Ersatz für bestehende Integrationen. Die preserve_thinking-Erweiterung fügt agentische Fähigkeiten hinzu, ohne die Kompatibilität zu beeinträchtigen. Batch-Verarbeitung auf DashScope läuft zu 50 % des Echtzeit-Preises.

OpenAI-Kompatibilität

Standard-Chat-Completions-Endpunkt mit Messages, Tools und Streaming-Unterstützung. Wechsle von OpenAI, indem du einfach die Base-URL und den API-Key änderst – keine Code-Änderungen nötig. Unterstützt Function Calling, JSON-Modus, strukturierte Ausgaben und Vision/multimodale Eingaben. Kompatibel mit Claude Code, OpenClaw, Aider, Continue.dev und jedem Tool, das das OpenAI-API-Format unterstützt. Das 1M-Kontextfenster unterstützt bis zu 65.536 Ausgabe-Token pro Anfrage.

DashScope-Preise

Direkter API-Zugang über Alibaba Clouds DashScope-Plattform mit wettbewerbsfähigen Preisen. qwen-plus: 0,40 $ pro Million Input-Token, 2,40 $ pro Million Output-Token – rund 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben. Batch-Verarbeitung zu 50 % des Echtzeit-Preises für nicht latenzempfindliche Workloads wie Datenverarbeitung, Evaluierung und Massengenerierung. Registriere dich für einen API-Key auf dashscope.aliyuncs.com.

OpenRouter-Integration

Greife auf Qwen-3.6-Modelle über OpenRouters einheitliche API neben über 200 weiteren Modellen zu. Kostenlose Vorschaustufe unter qwen/qwen3.6-plus:free ohne Kreditkarte. Die kostenpflichtige Stufe nutzt Durchleitungspreise plus 5,5 % Gebühr. Ein einziger API-Key für Multi-Provider-Zugang mit automatischem Fallback und Lastverteilung. OpenRouter übernimmt Rate-Limiting und bietet Nutzungsanalysen über alle Modellanbieter.

preserve_thinking-Parameter

Einzigartige API-Erweiterung, die den internen Reasoning-Zustand des Modells über Agent-Loop-Iterationen hinweg beibehält. Setze preserve_thinking: true in deiner API-Anfrage, um redundantes Re-Reasoning in mehrstufigen Workflows zu reduzieren. Dies verbessert die Genauigkeit und reduziert den Token-Verbrauch in agentischen Pipelines um 15–30 % bei typischen mehrstufigen Aufgaben. Unverzichtbar für zuverlässige Agent-Loops mit Claude Code, OpenClaw und eigenen agentischen Frameworks.

Batch-Verarbeitung (50 % Rabatt)

DashScope bietet Batch-Verarbeitung zu 50 % des Echtzeit-Preises für Workloads, die keine sofortige Antwort erfordern. Reiche Anfragen-Batches ein und rufe Ergebnisse asynchron ab. Ideal für Datensatzverarbeitung, Modellevaluierung, Content-Generierungs-Pipelines und jeden Workflow, bei dem Latenz nicht kritisch ist. Batch-Jobs unterstützen dasselbe API-Format wie Echtzeit-Anfragen.

1M-Kontextfenster

Qwen 3.6 Plus unterstützt ein 1M-Token-Kontextfenster – genug, um ganze Codebasen, lange Forschungsarbeiten, Rechtsdokumente und ausgedehnte Mehrrunden-Gespräche in einem Durchgang zu verarbeiten. Kombiniert mit bis zu 65.536 Ausgabe-Token ermöglicht dies die Generierung vollständiger Dateien, detaillierter Analysen und umfassender Berichte ohne Kürzung. Das Kontextfenster ist sowohl auf DashScope als auch auf OpenRouter verfügbar.

SDK- und Framework-Unterstützung

Funktioniert mit jedem OpenAI-kompatiblen SDK: Python (openai), Node.js (openai), Go, Rust, Java und mehr. LangChain-, LlamaIndex-, AutoGen-, CrewAI- und Semantic-Kernel-Integrationen sind sofort einsatzbereit. Kein eigenes SDK nötig – ändere einfach die Base-URL. Das DashScope Python SDK bietet zusätzlich nativen Zugang mit erweiterten Funktionen wie Batch-Management und Nutzungsverfolgung.

Selbst gehostete API-Option

Für Teams, die volle Datenkontrolle benötigen: Stelle Qwen-3.6-Open-Weight-Modelle (27B, 35B A3B) mit vLLM, SGLang oder KTransformers bereit und erstelle deinen eigenen OpenAI-kompatiblen API-Endpunkt. Gleiches API-Format wie DashScope und OpenRouter, sodass dein Anwendungscode ohne Änderungen funktioniert. Keine Token-Kosten nach der Hardware-Investition.

API-Referenz

Schnellstart mit der Qwen-3.6-API

Wichtige Endpunkte, Preise, Parameter und Konfiguration für den Einstieg mit der Qwen-3.6-API über DashScope oder OpenRouter.

Wichtige Endpunkte und Funktionen

  • POST /v1/chat/completions – Chat-Completions (Streaming unterstützt)
  • POST /v1/embeddings – Text-Embeddings
  • GET /v1/models – Verfügbare Modelle auflisten
  • preserve_thinking: true – Reasoning-Zustand beibehalten
  • 1M-Kontextfenster, bis zu 65.536 Ausgabe-Token
  • Function Calling, JSON-Modus, strukturierte Ausgaben, Vision

Preise (DashScope)

  • qwen-plus Input: 0,40 $ pro Million Token
  • qwen-plus Output: 2,40 $ pro Million Token
  • Batch-Verarbeitung: 50 % des Echtzeit-Preises
  • Ca. 12-mal günstiger als Claude Opus 4.6 für vergleichbare Aufgaben
  • OpenRouter kostenlose Stufe: qwen/qwen3.6-plus:free (keine Kreditkarte)
  • OpenRouter kostenpflichtig: Durchleitungspreis + 5,5 % Gebühr

Verfügbare Modelle

  • qwen-3.6-plus – Flaggschiff, 1M Kontext, preserve_thinking
  • qwen-3.6-max – Erweitertes Reasoning, multimodal
  • qwen-3.6-27b – Dichtes Open-Weight-Modell, beste Coding-Leistung
  • qwen-3.6-35b-a3b – MoE Open-Weight-Modell, kosteneffizient
  • Selbst gehostet über vLLM, SGLang, KTransformers

Qwen-Ökosystem

Ein API-Format, mehrere Zugangspunkte, branchenführende Preise

Greife auf Qwen 3.6 über DashScope (0,40 $/2,40 $ pro M Token), OpenRouter (kostenlose Stufe verfügbar) oder selbst gehostetes vLLM zu – alles im gleichen OpenAI-kompatiblen API-Format mit preserve_thinking-Unterstützung.

DashScope

Direkte API, 0,40 $/2,40 $ pro M Token

Registrieren

OpenRouter

Einheitliche API mit kostenloser Stufe

Loslegen

Selbst gehostetes vLLM

Eigenen API-Endpunkt betreiben, null Token-Kosten

Bereitstellen

Python SDK

Standard-OpenAI-Python-Bibliothek, Drop-in-Ersatz

Installieren

API-Referenz

Vollständige Endpunkt- und Parameter-Dokumentation

Doku lesen

Preise

Nutzungsbasierte Preise, Batch mit 50 % Rabatt

Preise ansehen

Erste Schritte

Bereit, Qwen 3.6 zu integrieren? Starte mit der kostenlosen Stufe, skaliere mit 0,40 $/M Token

Chatte kostenlos, dann integriere über die OpenAI-kompatible API. Drop-in-Ersatz mit preserve_thinking für agentische Workflows. DashScope ab 0,40 $/2,40 $ pro Million Token oder OpenRouter kostenlose Stufe – keine Kreditkarte nötig.