Qwen 3.6 Plus

1Mコンテキスト、エージェントの達人 - ターミナルタスクでClaude 4.5 Opusを上回るプロプライエタリモデル

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウを持つAlibabaのプロプライエタリホスティングモデルです。SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6(Claude 4.5 Opusの59.3を上回る)を達成し、シームレスなエージェントループのためのpreserve_thinkingを導入。2026年3月31日よりOpenAI互換APIで利用可能。

機能

エージェントワークフローと長文コンテキストタスクのために設計

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウ、preserve_thinkingパラメータ、トップクラスのコーディングベンチマークを組み合わせ、複雑なマルチステップエージェントパイプラインに最適化されたモデルを提供します。

トップクラスのソフトウェアエンジニアリング

SWE-bench Verifiedで78.8%、SWE-bench Proで56.6を達成。1Mコンテキストウィンドウ全体を活用した深いコードベース理解で、実世界のGitHub Issueを解決します。

ターミナル操作の達人

Terminal-Bench 2.0で61.6を達成し、Claude 4.5 Opus(59.3)を上回ります。複雑なマルチステップのターミナルワークフロー、デバッグセッション、システム管理をエキスパートレベルで処理します。

エージェントツール使用

QwenClawBenchで57.2、MCPMarkで48.2を達成。preserve_thinkingパラメータにより、トークンの無駄なくエージェントループの反復間で推論状態を維持します。

1Mトークンコンテキスト

コードベース全体、長文の研究論文、拡張されたマルチターン会話を処理可能。TAU3-Benchで70.7を達成し、長文コンテキストでの優れたタスク完了能力を実証しています。

ドキュメント理解

OmniDocBench1.5で91.2、AI2D_TESTで94.4を達成。複雑なドキュメント、図表、視覚情報を高精度で解析する能力に優れています。

OpenAI互換API

既存のOpenAI API統合へのドロップイン置き換えが可能。preserve_thinkingパラメータにより、互換性を損なうことなくエージェントユースケース向けに標準APIを拡張します。

主なハイライト

業界をリードするエージェント性能

Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、ツール使用、ドキュメント理解ベンチマークでトップクラスの結果を達成しています。

主な実績

  • SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング
  • Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus(59.3)を上回る
  • SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング
  • QwenClawBench: 57.2 - エージェントツールオーケストレーション
  • MCPMark: 48.2 - MCPプロトコルツール使用

技術仕様

  • Alibaba Cloudによるプロプライエタリホスティングモデル
  • 1Mトークンコンテキストウィンドウ
  • エージェントループ向けpreserve_thinkingパラメータ
  • OpenAI互換API
  • 2026年3月31日リリース

パフォーマンス

1Mコンテキストとpreserve_thinkingによるエージェント性能の優位性

Qwen 3.6 Plusは、SWE-bench Verifiedで78.8%、Terminal-Bench 2.0で61.6を達成し、1Mトークンコンテキストとpreserve_thinking機能を備えたプロプライエタリエージェントモデルの新基準を確立しています。

Qwen 3.6 Plusは、ソフトウェアエンジニアリング、ターミナル操作、エージェントツール使用、ドキュメント理解において一貫したリーダーシップを発揮し、長文コンテキスト推論を必要とする複雑なマルチステップワークフローのために設計されています。

Qwen 3.6 Plus コーディング、エージェント、ドキュメント理解ベンチマークのパフォーマンス比較チャート

SWE-bench Verified: 78.8% - 実世界のソフトウェアエンジニアリング

Terminal-Bench 2.0: 61.6 - Claude 4.5 Opus(59.3)を上回る

SWE-bench Pro: 56.6 - 高度なソフトウェアエンジニアリング

QwenClawBench: 57.2 - エージェントツールオーケストレーション

OmniDocBench1.5: 91.2 - ドキュメント理解

ベンチマーク比較

Qwen 3.6 Plus vs 最先端プロプライエタリモデル

Qwen 3.6 Plusは、エージェントおよびソフトウェアエンジニアリングベンチマークでリードし、preserve_thinkingパラメータによりシームレスなマルチステップエージェントワークフローを実現します。

Benchmark
Qwen 3.6 Plus
プロプライエタリ
注目
Qwen 3.6 27B
デンス
Claude 4.5 Opus
プロプライエタリ
Qwen 3.6 Max
プロプライエタリ
SWE-bench Verified
実世界のソフトウェアエンジニアリング
78.8%77.2%--
Terminal-Bench 2.0
ターミナル操作
61.659.359.3-
SWE-bench Pro
高度なソフトウェアエンジニアリング
56.6---
QwenClawBench
エージェントツールオーケストレーション
57.2---
TAU3-Bench
長文コンテキストタスク完了
70.7---
MCPMark
MCPプロトコルツール使用
48.2---
OmniDocBench1.5
ドキュメント理解
91.2---
AI2D_TEST
図表理解
94.4---

ベンチマーク結果はQwen 3.6公式リリースより。2026年3月31日リリース。

preserve_thinking

エージェントループの反復間で推論状態を維持

preserve_thinkingパラメータは、エージェントフレームワークがツールコールの複数回の反復にわたってモデルの内部推論状態を維持できる、業界初のAPI機能です。ステップ間でチェーン・オブ・ソートのトークンを破棄する代わりに、preserve_thinkingがそれらをアクティブに保ち、冗長な再推論を削減してマルチステップタスクの精度を向上させます。

  • エージェントループの反復間で推論コンテキストを維持
  • マルチステップワークフローでの冗長な再推論を削減
  • preserve_thinking拡張を備えたOpenAI互換API
エージェントループの反復間で推論状態を維持

1Mコンテキスト

コードベース全体と長文ドキュメントを一度に処理

Qwen 3.6 Plusは、1Mトークンコンテキストウィンドウをサポートし、リポジトリ全体、長文の研究論文、拡張されたマルチターン会話の分析を可能にします。TAU3-Benchで70.7、OmniDocBench1.5で91.2と合わせて、深い長文コンテキスト理解を必要とするタスクに優れています。

  • コードベース全体に対応する1Mトークンコンテキストウィンドウ
  • TAU3-Bench 70.7 長文コンテキストタスク完了
  • OmniDocBench1.5 91.2 ドキュメント理解

Qwenエコシステム

Qwen 3.6モデルファミリーの一員

Qwen 3.6 Plusは、Alibabaの最新モデルファミリーにおけるプロプライエタリエージェントバリエーションで、長文コンテキストワークフローとマルチステップツール使用に最適化されています。

ドキュメント

API統合とエージェントワークフローの完全ガイド

ドキュメントを読む

APIリファレンス

preserve_thinking搭載のOpenAI互換エンドポイント

APIを見る

モデルカード

技術仕様と評価結果

詳細を見る

料金

APIアクセスの従量課金制

料金を見る

エージェントフレームワーク

LangChain、AutoGenなどの統合ガイド

はじめる

コミュニティ

Qwen開発者コミュニティに参加

参加する

はじめに

Qwen 3.6 Plusで構築を始めませんか?

無料ですぐにチャットを開始するか、エージェントワークフロー向けpreserve_thinking搭載のOpenAI互換APIで統合できます。