Qwen 3.6 Plus

1Mコンテキスト、エージェントの達人 - ターミナルタスクでClaude 4.5 Opusを上回るプロプライエタリモデル

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウを持つAlibabaのプロプライエタリホスティングモデルです。SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6（Claude 4.5 Opusの59.3を上回る）を達成し、シームレスなエージェントループのためのpreserve_thinkingを導入。2026年3月31日よりOpenAI互換APIで利用可能。

チャットを始めるベンチマークを見る

機能

エージェントワークフローと長文コンテキストタスクのために設計

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウ、preserve_thinkingパラメータ、トップクラスのコーディングベンチマークを組み合わせ、複雑なマルチステップエージェントパイプラインに最適化されたモデルを提供します。

トップクラスのソフトウェアエンジニアリング

SWE-bench Verifiedで78.8%、SWE-bench Proで56.6を達成。1Mコンテキストウィンドウ全体を活用した深いコードベース理解で、実世界のGitHub Issueを解決します。

ターミナル操作の達人

Terminal-Bench 2.0で61.6を達成し、Claude 4.5 Opus（59.3）を上回ります。複雑なマルチステップのターミナルワークフロー、デバッグセッション、システム管理をエキスパートレベルで処理します。

エージェントツール使用

QwenClawBenchで57.2、MCPMarkで48.2を達成。preserve_thinkingパラメータにより、トークンの無駄なくエージェントループの反復間で推論状態を維持します。

1Mトークンコンテキスト

コードベース全体、長文の研究論文、拡張されたマルチターン会話を処理可能。TAU3-Benchで70.7を達成し、長文コンテキストでの優れたタスク完了能力を実証しています。

ドキュメント理解

OmniDocBench1.5で91.2、AI2D_TESTで94.4を達成。複雑なドキュメント、図表、視覚情報を高精度で解析する能力に優れています。

OpenAI互換API

既存のOpenAI API統合へのドロップイン置き換えが可能。preserve_thinkingパラメータにより、互換性を損なうことなくエージェントユースケース向けに標準APIを拡張します。

主なハイライト

業界をリードするエージェント性能

Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、ツール使用、ドキュメント理解ベンチマークでトップクラスの結果を達成しています。

主な実績

SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング
Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus（59.3）を上回る
SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング
QwenClawBench: 57.2 - エージェントツールオーケストレーション
MCPMark: 48.2 - MCPプロトコルツール使用

技術仕様

Alibaba Cloudによるプロプライエタリホスティングモデル
1Mトークンコンテキストウィンドウ
エージェントループ向けpreserve_thinkingパラメータ
OpenAI互換API
2026年3月31日リリース

無料でチャットを始める APIドキュメント

パフォーマンス

1Mコンテキストとpreserve_thinkingによるエージェント性能の優位性

Qwen 3.6 Plusは、SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6を達成し、1Mトークンコンテキストとpreserve_thinking機能を備えたプロプライエタリエージェントモデルの新基準を確立しています。

Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、エージェントツール使用、ドキュメント理解において一貫したリーダーシップを発揮し、長文コンテキスト推論を必要とする複雑なマルチステップワークフローのために設計されています。

チャットを始める APIドキュメント

Qwen 3.6 Plus コーディング、エージェント、ドキュメント理解ベンチマークのパフォーマンス比較チャート

SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング

Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus（59.3）を上回る

SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング

QwenClawBench: 57.2 - エージェントツールオーケストレーション

OmniDocBench1.5: 91.2 - ドキュメント理解

ベンチマーク比較

Qwen 3.6 Plus vs 最先端プロプライエタリモデル

Qwen 3.6 Plusは、エージェントおよびソフトウェアエンジニアリングベンチマークでリードし、preserve_thinkingパラメータによりシームレスなマルチステップエージェントワークフローを実現します。

Benchmark	Qwen 3.6 Plus プロプライエタリ注目	Qwen 3.6 27B デンス	Claude 4.5 Opus プロプライエタリ	Qwen 3.6 Max プロプライエタリ
SWE-bench Verified 実世界のソフトウェアエンジニアリング	78.8%	77.2%	-	-
Terminal-Bench 2.0 ターミナル操作	61.6	59.3	59.3	-
SWE-bench Pro 高度なソフトウェアエンジニアリング	56.6	-	-	-
QwenClawBench エージェントツールオーケストレーション	57.2	-	-	-
TAU3-Bench 長文コンテキストタスク完了	70.7	-	-	-
MCPMark MCPプロトコルツール使用	48.2	-	-	-
OmniDocBench1.5 ドキュメント理解	91.2	-	-	-
AI2D_TEST 図表理解	94.4	-	-	-

ベンチマーク結果はQwen 3.6公式リリースより。2026年3月31日リリース。

preserve_thinking

エージェントループの反復間で推論状態を維持

preserve_thinkingパラメータは、エージェントフレームワークがツールコールの複数回の反復にわたってモデルの内部推論状態を維持できる、業界初のAPI機能です。ステップ間でチェーン・オブ・ソートのトークンを破棄する代わりに、preserve_thinkingがそれらをアクティブに保ち、冗長な再推論を削減してマルチステップタスクの精度を向上させます。

エージェントループの反復間で推論コンテキストを維持
マルチステップワークフローでの冗長な再推論を削減
preserve_thinking拡張を備えたOpenAI互換API

チャットを始める APIドキュメント

1Mコンテキスト

コードベース全体と長文ドキュメントを一度に処理

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウをサポートし、リポジトリ全体、長文の研究論文、拡張されたマルチターン会話の分析を可能にします。TAU3-Benchで70.7、OmniDocBench1.5で91.2と合わせて、深い長文コンテキスト理解を必要とするタスクに優れています。