Qwen 3.6 Plus
1Mコンテキスト、エージェントの達人 - ターミナルタスクでClaude 4.5 Opusを上回るプロプライエタリモデル
Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウを持つAlibabaのプロプライエタリホスティングモデルです。SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6(Claude 4.5 Opusの59.3を上回る)を達成し、シームレスなエージェントループのためのpreserve_thinkingを導入。2026年3月31日よりOpenAI互換APIで利用可能。
機能
エージェントワークフローと長文コンテキストタスクのために設計
Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウ、preserve_thinkingパラメータ、トップクラスのコーディングベンチマークを組み合わせ、複雑なマルチステップエージェントパイプラインに最適化されたモデルを提供します。
トップクラスのソフトウェアエンジニアリング
SWE-bench Verifiedで78.8%、SWE-bench Proで56.6を達成。1Mコンテキストウィンドウ全体を活用した深いコードベース理解で、実世界のGitHub Issueを解決します。
ターミナル操作の達人
Terminal-Bench 2.0で61.6を達成し、Claude 4.5 Opus(59.3)を上回ります。複雑なマルチステップのターミナルワークフロー、デバッグセッション、システム管理をエキスパートレベルで処理します。
エージェントツール使用
QwenClawBenchで57.2、MCPMarkで48.2を達成。preserve_thinkingパラメータにより、トークンの無駄なくエージェントループの反復間で推論状態を維持します。
1Mトークンコンテキスト
コードベース全体、長文の研究論文、拡張されたマルチターン会話を処理可能。TAU3-Benchで70.7を達成し、長文コンテキストでの優れたタスク完了能力を実証しています。
ドキュメント理解
OmniDocBench1.5で91.2、AI2D_TESTで94.4を達成。複雑なドキュメント、図表、視覚情報を高精度で解析する能力に優れています。
OpenAI互換API
既存のOpenAI API統合へのドロップイン置き換えが可能。preserve_thinkingパラメータにより、互換性を損なうことなくエージェントユースケース向けに標準APIを拡張します。
主なハイライト
業界をリードするエージェント性能
Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、ツール使用、ドキュメント理解ベンチマークでトップクラスの結果を達成しています。
主な実績
- SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング
- Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus(59.3)を上回る
- SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング
- QwenClawBench: 57.2 - エージェントツールオーケストレーション
- MCPMark: 48.2 - MCPプロトコルツール使用
技術仕様
- Alibaba Cloudによるプロプライエタリホスティングモデル
- 1Mトークンコンテキストウィンドウ
- エージェントループ向けpreserve_thinkingパラメータ
- OpenAI互換API
- 2026年3月31日リリース
パフォーマンス
1Mコンテキストとpreserve_thinkingによるエージェント性能の優位性
Qwen 3.6 Plusは、SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6を達成し、1Mトークンコンテキストとpreserve_thinking機能を備えたプロプライエタリエージェントモデルの新基準を確立しています。
Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、エージェントツール使用、ドキュメント理解において一貫したリーダーシップを発揮し、長文コンテキスト推論を必要とする複雑なマルチステップワークフローのために設計されています。


SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング
Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus(59.3)を上回る
SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング
QwenClawBench: 57.2 - エージェントツールオーケストレーション
OmniDocBench1.5: 91.2 - ドキュメント理解
ベンチマーク比較
Qwen 3.6 Plus vs 最先端プロプライエタリモデル
Qwen 3.6 Plusは、エージェントおよびソフトウェアエンジニアリングベンチマークでリードし、preserve_thinkingパラメータによりシームレスなマルチステップエージェントワークフローを実現します。
| Benchmark | Qwen 3.6 Plus プロプライエタリ 注目 | Qwen 3.6 27B デンス | Claude 4.5 Opus プロプライエタリ | Qwen 3.6 Max プロプライエタリ |
|---|---|---|---|---|
SWE-bench Verified 実世界のソフトウェアエンジニアリング | 78.8% | 77.2% | - | - |
Terminal-Bench 2.0 ターミナル操作 | 61.6 | 59.3 | 59.3 | - |
SWE-bench Pro 高度なソフトウェアエンジニアリング | 56.6 | - | - | - |
QwenClawBench エージェントツールオーケストレーション | 57.2 | - | - | - |
TAU3-Bench 長文コンテキストタスク完了 | 70.7 | - | - | - |
MCPMark MCPプロトコルツール使用 | 48.2 | - | - | - |
OmniDocBench1.5 ドキュメント理解 | 91.2 | - | - | - |
AI2D_TEST 図表理解 | 94.4 | - | - | - |
ベンチマーク結果はQwen 3.6公式リリースより。2026年3月31日リリース。
preserve_thinking
エージェントループの反復間で推論状態を維持
preserve_thinkingパラメータは、エージェントフレームワークがツールコールの複数回の反復にわたってモデルの内部推論状態を維持できる、業界初のAPI機能です。ステップ間でチェーン・オブ・ソートのトークンを破棄する代わりに、preserve_thinkingがそれらをアクティブに保ち、冗長な再推論を削減してマルチステップタスクの精度を向上させます。
- エージェントループの反復間で推論コンテキストを維持
- マルチステップワークフローでの冗長な再推論を削減
- preserve_thinking拡張を備えたOpenAI互換API

1Mコンテキスト
コードベース全体と長文ドキュメントを一度に処理
Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウをサポートし、リポジトリ全体、長文の研究論文、拡張されたマルチターン会話の分析を可能にします。TAU3-Benchで70.7、OmniDocBench1.5で91.2と合わせて、深い長文コンテキスト理解を必要とするタスクに優れています。
- コードベース全体に対応する1Mトークンコンテキストウィンドウ
- TAU3-Bench 70.7 長文コンテキストタスク完了
- OmniDocBench1.5 91.2 ドキュメント理解
はじめに
Qwen 3.6 Plusを今すぐ試す
すぐにチャットを開始するか、OpenAI互換APIで統合できます。
統合ガイド
Qwen 3.6 Plusで構築する
OpenAI互換SDKとエージェントフレームワークを使用して、Qwen 3.6 Plusをアプリケーションに統合できます。
Qwenエコシステム
Qwen 3.6モデルファミリーの一員
Qwen 3.6 Plusは、Alibabaの最新モデルファミリーにおけるプロプライエタリエージェントバリエーションで、長文コンテキストワークフローとマルチステップツール使用に最適化されています。
はじめに
Qwen 3.6 Plusで構築を始めませんか?
無料ですぐにチャットを開始するか、エージェントワークフロー向けpreserve_thinking搭載のOpenAI互換APIで統合できます。