Qwen 3.6 API

preserve_thinking搭載のOpenAI互換API – Claude Opus 4.6の12分の1の価格

OpenAI互換APIでQwen 3.6 Plus、Max、オープンウェイトモデルにアクセスできます。DashScopeの料金はqwen-plusで100万入力トークンあたり$0.40、100万出力トークンあたり$2.40から。Claude Opus 4.6の約12分の1の価格です。既存のOpenAI統合のドロップイン置き換えとして、preserve_thinkingパラメータでエージェントループ間の推論状態を維持できます。1Mトークンのコンテキストウィンドウで最大65,536出力トークン。DashScope直接およびOpenRouter(無料プレビュー枠あり)で利用可能。

APIガイド

最小限のコード変更でQwen 3.6をアプリケーションに統合

Qwen 3.6 APIはOpenAIのチャットコンプリーション形式に準拠しており、既存の統合のドロップイン置き換えとして機能します。preserve_thinking拡張は互換性を損なうことなくエージェント機能を追加します。DashScopeのバッチ処理はリアルタイム料金の50%で利用できます。

OpenAI互換性

メッセージ、ツール、ストリーミングをサポートする標準チャットコンプリーションエンドポイント。ベースURLとAPIキーを変更するだけでOpenAIから切り替え可能 – コード変更は不要です。ファンクションコール、JSONモード、構造化出力、ビジョン/マルチモーダル入力をサポート。Claude Code、OpenClaw、Aider、Continue.dev、およびOpenAI APIフォーマットをサポートするあらゆるツールと互換性があります。1Mコンテキストウィンドウはリクエストあたり最大65,536出力トークンをサポートします。

DashScope料金

Alibaba CloudのDashScopeプラットフォームを通じた競争力のある価格での直接APIアクセス。qwen-plus:100万入力トークンあたり$0.40、100万出力トークンあたり$2.40 – 同等のタスクでClaude Opus 4.6の約12分の1の価格。レイテンシに敏感でないワークロード(データ処理、評価、一括生成など)向けにリアルタイム料金の50%でバッチ処理が利用可能。dashscope.aliyuncs.comでAPIキーを取得できます。

OpenRouter統合

OpenRouterの統合APIを通じて200以上の他のモデルとともにQwen 3.6モデルにアクセスできます。qwen/qwen3.6-plus:freeで無料プレビュー枠が利用可能(クレジットカード不要)。有料枠はパススルー料金に5.5%の手数料が加算されます。マルチプロバイダーアクセス用の単一APIキーで、自動フォールバックとロードバランシングに対応。OpenRouterがレート制限を管理し、すべてのモデルプロバイダーの利用分析を提供します。

preserve_thinkingパラメータ

エージェントループのイテレーション間でモデルの内部推論状態を維持する、業界初のAPI拡張機能です。APIリクエストでpreserve_thinking: trueを設定すると、マルチステップワークフローでの冗長な再推論を削減できます。典型的なマルチステップタスクでエージェントパイプラインの精度を向上させ、トークン使用量を15〜30%削減します。Claude Code、OpenClaw、カスタムエージェントフレームワークで信頼性の高いエージェントループを構築するために不可欠です。

バッチ処理(50%オフ)

DashScopeは即時応答を必要としないワークロード向けに、リアルタイム料金の50%でバッチ処理を提供しています。リクエストのバッチを送信し、結果を非同期で取得できます。データセット処理、モデル評価、コンテンツ生成パイプライン、レイテンシが重要でないあらゆるワークフローに最適です。バッチジョブはリアルタイムリクエストと同じAPIフォーマットをサポートします。

1Mコンテキストウィンドウ

Qwen 3.6 Plusは1Mトークンのコンテキストウィンドウをサポートしています。コードベース全体、長い研究論文、法律文書、長時間のマルチターン会話を一度に処理するのに十分な容量です。最大65,536出力トークンと組み合わせることで、完全なファイル、詳細な分析、包括的なレポートを切り捨てなしで生成できます。コンテキストウィンドウはDashScopeとOpenRouterの両方で利用可能です。

SDKとフレームワークサポート

あらゆるOpenAI互換SDKで動作します:Python(openai)、Node.js(openai)、Go、Rust、Java など。LangChain、LlamaIndex、AutoGen、CrewAI、Semantic Kernelの統合がすぐに利用可能です。カスタムSDKは不要 – ベースURLを変更するだけです。DashScope Python SDKはバッチ管理や利用追跡などの追加機能を備えたネイティブアクセスも提供します。

セルフホストAPIオプション

完全なデータ管理が必要なチーム向けに、Qwen 3.6オープンウェイトモデル(27B、35B A3B)をvLLM、SGLang、またはKTransformersでデプロイして独自のOpenAI互換APIエンドポイントを作成できます。DashScopeやOpenRouterと同じAPIフォーマットなので、アプリケーションコードは変更なしで動作します。ハードウェア投資後のトークンコストはゼロです。

APIリファレンス

Qwen 3.6 APIクイックスタート

DashScopeまたはOpenRouterでQwen 3.6 APIを始めるための主要なエンドポイント、料金、パラメータ、設定。

主要エンドポイントと機能

  • POST /v1/chat/completions – チャットコンプリーション(ストリーミング対応)
  • POST /v1/embeddings – テキストエンベディング
  • GET /v1/models – 利用可能なモデル一覧
  • preserve_thinking: true – 推論状態の永続化を有効化
  • 1Mコンテキストウィンドウ、最大65,536出力トークン
  • ファンクションコール、JSONモード、構造化出力、ビジョン

料金(DashScope)

  • qwen-plus 入力:100万トークンあたり$0.40
  • qwen-plus 出力:100万トークンあたり$2.40
  • バッチ処理:リアルタイム料金の50%
  • 同等タスクでClaude Opus 4.6の約12分の1の価格
  • OpenRouter無料枠:qwen/qwen3.6-plus:free(クレジットカード不要)
  • OpenRouter有料:パススルー料金 + 5.5%手数料

利用可能なモデル

  • qwen-3.6-plus – フラッグシップ、1Mコンテキスト、preserve_thinking
  • qwen-3.6-max – 高度な推論、マルチモーダル
  • qwen-3.6-27b – デンスオープンウェイト、最高のコーディング性能
  • qwen-3.6-35b-a3b – MoEオープンウェイト、コスト効率が高い
  • vLLM、SGLang、KTransformersでセルフホスト

高度な使い方

preserve_thinkingとツールコールでエージェントワークフローを構築

preserve_thinkingパラメータ、ファンクションコール、1Mコンテキストを活用して、複雑なマルチステップエージェントパイプラインや本番アプリケーションを構築しましょう。

Qwenエコシステム

1つのAPIフォーマット、複数のアクセスポイント、業界最高水準の料金

DashScope(100万トークンあたり$0.40/$2.40)、OpenRouter(無料枠あり)、またはセルフホストvLLMでQwen 3.6にアクセス – すべて同じOpenAI互換APIフォーマットでpreserve_thinkingをサポート。

DashScope

直接API、100万トークンあたり$0.40/$2.40

サインアップ

OpenRouter

統合APIと無料枠

始める

セルフホストvLLM

独自APIエンドポイント、トークンコストゼロ

デプロイ

Python SDK

標準OpenAI Pythonライブラリ、ドロップイン置き換え

インストール

APIリファレンス

エンドポイントとパラメータの完全なドキュメント

ドキュメントを読む

料金

従量課金、バッチは50%オフ

料金を見る

はじめに

Qwen 3.6を統合する準備はできましたか?無料枠で始めて、$0.40/Mトークンでスケール

無料でチャットを始めて、OpenAI互換APIで統合しましょう。エージェントワークフロー向けpreserve_thinking搭載のドロップイン置き換え。DashScopeは100万トークンあたり$0.40/$2.40、またはOpenRouter無料枠 – クレジットカード不要。