Qwen 3.6 vs DeepSeek V4

DeepSeek V4が参入する中、Qwen 3.6 Plusは実証済みの結果でエージェントベンチマークをリード

DeepSeek V4は約1TパラメータのMoEアーキテクチャと1Mコンテキストウィンドウを備え、AI分野の強力な新たな競合です。しかしQwen 3.6 Plusは既に実証済みのベンチマークでリード:SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6、エージェントワークフロー向けのpreserve_thinkingパラメータ。$0.40/$2.40/百万トークン(Claude Opus 4.6の約12分の1)で、Qwen 3.6は比類のないコストパフォーマンスを提供。DeepSeek V4 Proは1.6Tパラメータに拡張。Qwenはローカルデプロイ用のオープンウェイトモデル(27B:SWE-bench 77.2%、35B A3B)も提供しています。

ベンチマーク

Qwen 3.6 vs DeepSeek V4 — 利用可能なベンチマークデータと仕様

現在利用可能なデータに基づくベンチマーク比較。Qwen 3.6 PlusはSWE-bench、Terminal-Bench、SkillsBench、ツール使用評価で実証済みの結果によりエージェントコーディングベンチマークをリード。DeepSeek V4のデータはより多くの結果が公開され次第更新されます。

Qwen 3.6 Plusはソフトウェアエンジニアリングとエージェントコーディングタスクで強力なベンチマークポジションを確立しており、27Bオープンウェイトモデルはほぼ同等の性能を発揮しています。DeepSeek V4のロールアウト完了に伴い、より包括的な比較が可能になります。現在のデータでは、Qwen 3.6が主要なエージェントベンチマークで実証済みかつ再現可能な結果と成熟したデプロイエコシステムでリードしています。

SWE-bench、Terminal-Bench、SkillsBenchを含む利用可能なベンチマークにおけるQwen 3.6 vs DeepSeek V4の性能を示すベンチマーク比較チャート

Qwen 3.6 Plus:SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6

Qwen 3.6 27B:SWE-bench 77.2%、SkillsBench 48.2(Claude 4.5 Opusを上回る)

Qwen 3.6 27B:LiveCodeBench 83.9、QwenWebBench 1487、Claw-Eval 72.4

両モデル:1Mトークンコンテキストウィンドウ

Qwen 3.6 Plus:$0.40/$2.40/Mトークン、バッチ50%オフ

ベンチマーク表

Qwen 3.6 vs DeepSeek V4 — 現在の結果と仕様

両モデルファミリーの利用可能なベンチマークデータ。DeepSeek V4の結果はより多くのデータが公開され次第更新されます。Qwen 3.6の結果は再現可能な評価による公式リリースからのものです。

Benchmark
Qwen 3.6 Plus
プロプライエタリ
利用可能
Qwen 3.6 27B
Denseオープンウェイト
Qwen 3.6 35B A3B
MoEオープンウェイト
DeepSeek V4
約1T MoE
DeepSeek V4 Pro
1.6T MoE
SWE-bench Verified
実際のソフトウェアエンジニアリング
78.8%77.2%73.4%--
Terminal-Bench 2.0
ターミナル操作
61.659.351.5--
SkillsBench
実践的コーディングスキル
-48.2---
LiveCodeBench
競技プログラミング
-83.980.4--
Claw-Eval Avg
エンドツーエンドのエージェントコーディング
-72.468.7--
Context window
最大コンテキスト長
1Mトークン128Kトークン128Kトークン1Mトークン1Mトークン
Architecture
モデルアーキテクチャ
プロプライエタリ27B Dense35B MoE(3Bアクティブ)約1T MoE1.6T MoE
preserve_thinking
エージェント推論の永続化
対応非対応非対応非対応非対応
Open-weight
ローカルデプロイ可能
非対応対応(Apache 2.0)対応(Apache 2.0)未定未定

Qwen 3.6データは公式リリース(2026年3月)より。DeepSeek V4データは初期ローンチレポート(2026年4月)より。一部のDeepSeek V4ベンチマークは完全な公開待ち。

Qwenエコシステム

実証済みのエージェント性能、今すぐ利用可能、業界最高水準の料金

Qwen 3.6は実証済みのベンチマーク、Apache 2.0のオープンウェイトモデル、エージェントワークフロー向けpreserve_thinking、$0.40/$2.40/百万トークンの料金で完全に利用可能です。ベンチマークを待つ必要はありません — 今すぐ構築を始めましょう。

Qwen 3.6 Plus

SWE-bench 78.8%、$0.40/Mトークン

Plusを試す

Qwen 3.6 27B

SWE-bench 77.2%、オープンウェイト、Apache 2.0

27Bを試す

Qwen 3.6 35B A3B

SWE-bench 73.4%、コンシューマーGPU対応

35Bを試す

APIアクセス

OpenAI互換、preserve_thinking、無料枠あり

APIを見る

ローカル実行

Ollama、vLLM、llama.cpp、SGLang

始める

コミュニティ

Qwen開発者コミュニティに参加

参加する

Qwen 3.6を試す

ベンチマークを待つ必要なし — 実証済みのエージェント性能を今すぐ体験

Qwen 3.6はSWE-bench 78.8%、preserve_thinking、$0.40/$2.40/百万トークンで完全に利用可能です。無料でチャット、オープンウェイトモデルでローカルデプロイ、またはOpenAI互換APIで統合。Claude Code、OpenClaw、Aider、Continue.devと連携します。