Qwen 3.6 API
preserve_thinking搭載のOpenAI互換API – Claude Opus 4.6の12分の1の価格
OpenAI互換APIでQwen 3.6 Plus、Max、オープンウェイトモデルにアクセスできます。DashScopeの料金はqwen-plusで100万入力トークンあたり$0.40、100万出力トークンあたり$2.40から。Claude Opus 4.6の約12分の1の価格です。既存のOpenAI統合のドロップイン置き換えとして、preserve_thinkingパラメータでエージェントループ間の推論状態を維持できます。1Mトークンのコンテキストウィンドウで最大65,536出力トークン。DashScope直接およびOpenRouter(無料プレビュー枠あり)で利用可能。
APIガイド
最小限のコード変更でQwen 3.6をアプリケーションに統合
Qwen 3.6 APIはOpenAIのチャットコンプリーション形式に準拠しており、既存の統合のドロップイン置き換えとして機能します。preserve_thinking拡張は互換性を損なうことなくエージェント機能を追加します。DashScopeのバッチ処理はリアルタイム料金の50%で利用できます。
OpenAI互換性
メッセージ、ツール、ストリーミングをサポートする標準チャットコンプリーションエンドポイント。ベースURLとAPIキーを変更するだけでOpenAIから切り替え可能 – コード変更は不要です。ファンクションコール、JSONモード、構造化出力、ビジョン/マルチモーダル入力をサポート。Claude Code、OpenClaw、Aider、Continue.dev、およびOpenAI APIフォーマットをサポートするあらゆるツールと互換性があります。1Mコンテキストウィンドウはリクエストあたり最大65,536出力トークンをサポートします。
DashScope料金
Alibaba CloudのDashScopeプラットフォームを通じた競争力のある価格での直接APIアクセス。qwen-plus:100万入力トークンあたり$0.40、100万出力トークンあたり$2.40 – 同等のタスクでClaude Opus 4.6の約12分の1の価格。レイテンシに敏感でないワークロード(データ処理、評価、一括生成など)向けにリアルタイム料金の50%でバッチ処理が利用可能。dashscope.aliyuncs.comでAPIキーを取得できます。
OpenRouter統合
OpenRouterの統合APIを通じて200以上の他のモデルとともにQwen 3.6モデルにアクセスできます。qwen/qwen3.6-plus:freeで無料プレビュー枠が利用可能(クレジットカード不要)。有料枠はパススルー料金に5.5%の手数料が加算されます。マルチプロバイダーアクセス用の単一APIキーで、自動フォールバックとロードバランシングに対応。OpenRouterがレート制限を管理し、すべてのモデルプロバイダーの利用分析を提供します。
preserve_thinkingパラメータ
エージェントループのイテレーション間でモデルの内部推論状態を維持する、業界初のAPI拡張機能です。APIリクエストでpreserve_thinking: trueを設定すると、マルチステップワークフローでの冗長な再推論を削減できます。典型的なマルチステップタスクでエージェントパイプラインの精度を向上させ、トークン使用量を15〜30%削減します。Claude Code、OpenClaw、カスタムエージェントフレームワークで信頼性の高いエージェントループを構築するために不可欠です。
バッチ処理(50%オフ)
DashScopeは即時応答を必要としないワークロード向けに、リアルタイム料金の50%でバッチ処理を提供しています。リクエストのバッチを送信し、結果を非同期で取得できます。データセット処理、モデル評価、コンテンツ生成パイプライン、レイテンシが重要でないあらゆるワークフローに最適です。バッチジョブはリアルタイムリクエストと同じAPIフォーマットをサポートします。
1Mコンテキストウィンドウ
Qwen 3.6 Plusは1Mトークンのコンテキストウィンドウをサポートしています。コードベース全体、長い研究論文、法律文書、長時間のマルチターン会話を一度に処理するのに十分な容量です。最大65,536出力トークンと組み合わせることで、完全なファイル、詳細な分析、包括的なレポートを切り捨てなしで生成できます。コンテキストウィンドウはDashScopeとOpenRouterの両方で利用可能です。
SDKとフレームワークサポート
あらゆるOpenAI互換SDKで動作します:Python(openai)、Node.js(openai)、Go、Rust、Java など。LangChain、LlamaIndex、AutoGen、CrewAI、Semantic Kernelの統合がすぐに利用可能です。カスタムSDKは不要 – ベースURLを変更するだけです。DashScope Python SDKはバッチ管理や利用追跡などの追加機能を備えたネイティブアクセスも提供します。
セルフホストAPIオプション
完全なデータ管理が必要なチーム向けに、Qwen 3.6オープンウェイトモデル(27B、35B A3B)をvLLM、SGLang、またはKTransformersでデプロイして独自のOpenAI互換APIエンドポイントを作成できます。DashScopeやOpenRouterと同じAPIフォーマットなので、アプリケーションコードは変更なしで動作します。ハードウェア投資後のトークンコストはゼロです。
APIリファレンス
Qwen 3.6 APIクイックスタート
DashScopeまたはOpenRouterでQwen 3.6 APIを始めるための主要なエンドポイント、料金、パラメータ、設定。
主要エンドポイントと機能
- POST /v1/chat/completions – チャットコンプリーション(ストリーミング対応)
- POST /v1/embeddings – テキストエンベディング
- GET /v1/models – 利用可能なモデル一覧
- preserve_thinking: true – 推論状態の永続化を有効化
- 1Mコンテキストウィンドウ、最大65,536出力トークン
- ファンクションコール、JSONモード、構造化出力、ビジョン
料金(DashScope)
- qwen-plus 入力:100万トークンあたり$0.40
- qwen-plus 出力:100万トークンあたり$2.40
- バッチ処理:リアルタイム料金の50%
- 同等タスクでClaude Opus 4.6の約12分の1の価格
- OpenRouter無料枠:qwen/qwen3.6-plus:free(クレジットカード不要)
- OpenRouter有料:パススルー料金 + 5.5%手数料
利用可能なモデル
- qwen-3.6-plus – フラッグシップ、1Mコンテキスト、preserve_thinking
- qwen-3.6-max – 高度な推論、マルチモーダル
- qwen-3.6-27b – デンスオープンウェイト、最高のコーディング性能
- qwen-3.6-35b-a3b – MoEオープンウェイト、コスト効率が高い
- vLLM、SGLang、KTransformersでセルフホスト
はじめに
数分でQwen 3.6 APIを使った開発を開始
APIキーを取得して最初のリクエストを送信しましょう。OpenAI互換フォーマットなので、使い慣れたツールやSDKですぐに始められます。
高度な使い方
preserve_thinkingとツールコールでエージェントワークフローを構築
preserve_thinkingパラメータ、ファンクションコール、1Mコンテキストを活用して、複雑なマルチステップエージェントパイプラインや本番アプリケーションを構築しましょう。