Qwen 3.6 vs DeepSeek V4
DeepSeek V4が参入する中、Qwen 3.6 Plusは実証済みの結果でエージェントベンチマークをリード
DeepSeek V4は約1TパラメータのMoEアーキテクチャと1Mコンテキストウィンドウを備え、AI分野の強力な新たな競合です。しかしQwen 3.6 Plusは既に実証済みのベンチマークでリード:SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6、エージェントワークフロー向けのpreserve_thinkingパラメータ。$0.40/$2.40/百万トークン(Claude Opus 4.6の約12分の1)で、Qwen 3.6は比類のないコストパフォーマンスを提供。DeepSeek V4 Proは1.6Tパラメータに拡張。Qwenはローカルデプロイ用のオープンウェイトモデル(27B:SWE-bench 77.2%、35B A3B)も提供しています。
ベンチマーク
Qwen 3.6 vs DeepSeek V4 — 利用可能なベンチマークデータと仕様
現在利用可能なデータに基づくベンチマーク比較。Qwen 3.6 PlusはSWE-bench、Terminal-Bench、SkillsBench、ツール使用評価で実証済みの結果によりエージェントコーディングベンチマークをリード。DeepSeek V4のデータはより多くの結果が公開され次第更新されます。
Qwen 3.6 Plusはソフトウェアエンジニアリングとエージェントコーディングタスクで強力なベンチマークポジションを確立しており、27Bオープンウェイトモデルはほぼ同等の性能を発揮しています。DeepSeek V4のロールアウト完了に伴い、より包括的な比較が可能になります。現在のデータでは、Qwen 3.6が主要なエージェントベンチマークで実証済みかつ再現可能な結果と成熟したデプロイエコシステムでリードしています。


Qwen 3.6 Plus:SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6
Qwen 3.6 27B:SWE-bench 77.2%、SkillsBench 48.2(Claude 4.5 Opusを上回る)
Qwen 3.6 27B:LiveCodeBench 83.9、QwenWebBench 1487、Claw-Eval 72.4
両モデル:1Mトークンコンテキストウィンドウ
Qwen 3.6 Plus:$0.40/$2.40/Mトークン、バッチ50%オフ
ベンチマーク表
Qwen 3.6 vs DeepSeek V4 — 現在の結果と仕様
両モデルファミリーの利用可能なベンチマークデータ。DeepSeek V4の結果はより多くのデータが公開され次第更新されます。Qwen 3.6の結果は再現可能な評価による公式リリースからのものです。
| Benchmark | Qwen 3.6 Plus プロプライエタリ 利用可能 | Qwen 3.6 27B Denseオープンウェイト | Qwen 3.6 35B A3B MoEオープンウェイト | DeepSeek V4 約1T MoE | DeepSeek V4 Pro 1.6T MoE |
|---|---|---|---|---|---|
SWE-bench Verified 実際のソフトウェアエンジニアリング | 78.8% | 77.2% | 73.4% | - | - |
Terminal-Bench 2.0 ターミナル操作 | 61.6 | 59.3 | 51.5 | - | - |
SkillsBench 実践的コーディングスキル | - | 48.2 | - | - | - |
LiveCodeBench 競技プログラミング | - | 83.9 | 80.4 | - | - |
Claw-Eval Avg エンドツーエンドのエージェントコーディング | - | 72.4 | 68.7 | - | - |
Context window 最大コンテキスト長 | 1Mトークン | 128Kトークン | 128Kトークン | 1Mトークン | 1Mトークン |
Architecture モデルアーキテクチャ | プロプライエタリ | 27B Dense | 35B MoE(3Bアクティブ) | 約1T MoE | 1.6T MoE |
preserve_thinking エージェント推論の永続化 | 対応 | 非対応 | 非対応 | 非対応 | 非対応 |
Open-weight ローカルデプロイ可能 | 非対応 | 対応(Apache 2.0) | 対応(Apache 2.0) | 未定 | 未定 |
Qwen 3.6データは公式リリース(2026年3月)より。DeepSeek V4データは初期ローンチレポート(2026年4月)より。一部のDeepSeek V4ベンチマークは完全な公開待ち。
Qwenエコシステム
実証済みのエージェント性能、今すぐ利用可能、業界最高水準の料金
Qwen 3.6は実証済みのベンチマーク、Apache 2.0のオープンウェイトモデル、エージェントワークフロー向けpreserve_thinking、$0.40/$2.40/百万トークンの料金で完全に利用可能です。ベンチマークを待つ必要はありません — 今すぐ構築を始めましょう。