Qwen 3.6 vs DeepSeek V4

DeepSeek V4が参入する中、Qwen 3.6 Plusは実証済みの結果でエージェントベンチマークをリード

DeepSeek V4は約1TパラメータのMoEアーキテクチャと1Mコンテキストウィンドウを備え、AI分野の強力な新たな競合です。しかしQwen 3.6 Plusは既に実証済みのベンチマークでリード：SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6、エージェントワークフロー向けのpreserve_thinkingパラメータ。$0.40/$2.40/百万トークン（Claude Opus 4.6の約12分の1）で、Qwen 3.6は比類のないコストパフォーマンスを提供。DeepSeek V4 Proは1.6Tパラメータに拡張。Qwenはローカルデプロイ用のオープンウェイトモデル（27B：SWE-bench 77.2%、35B A3B）も提供しています。

Qwen 3.6を試すベンチマークを見る

ベンチマーク

Qwen 3.6 vs DeepSeek V4 — 利用可能なベンチマークデータと仕様

現在利用可能なデータに基づくベンチマーク比較。Qwen 3.6 PlusはSWE-bench、Terminal-Bench、SkillsBench、ツール使用評価で実証済みの結果によりエージェントコーディングベンチマークをリード。DeepSeek V4のデータはより多くの結果が公開され次第更新されます。

Qwen 3.6 Plusはソフトウェアエンジニアリングとエージェントコーディングタスクで強力なベンチマークポジションを確立しており、27Bオープンウェイトモデルはほぼ同等の性能を発揮しています。DeepSeek V4のロールアウト完了に伴い、より包括的な比較が可能になります。現在のデータでは、Qwen 3.6が主要なエージェントベンチマークで実証済みかつ再現可能な結果と成熟したデプロイエコシステムでリードしています。

Qwen 3.6を試す APIドキュメント

SWE-bench、Terminal-Bench、SkillsBenchを含む利用可能なベンチマークにおけるQwen 3.6 vs DeepSeek V4の性能を示すベンチマーク比較チャート

Qwen 3.6 Plus：SWE-bench Verified 78.8%、Terminal-Bench 2.0 61.6

Qwen 3.6 27B：SWE-bench 77.2%、SkillsBench 48.2（Claude 4.5 Opusを上回る）

Qwen 3.6 27B：LiveCodeBench 83.9、QwenWebBench 1487、Claw-Eval 72.4

両モデル：1Mトークンコンテキストウィンドウ

Qwen 3.6 Plus：$0.40/$2.40/Mトークン、バッチ50%オフ

ベンチマーク表

Qwen 3.6 vs DeepSeek V4 — 現在の結果と仕様

両モデルファミリーの利用可能なベンチマークデータ。DeepSeek V4の結果はより多くのデータが公開され次第更新されます。Qwen 3.6の結果は再現可能な評価による公式リリースからのものです。

Benchmark	Qwen 3.6 Plus プロプライエタリ利用可能	Qwen 3.6 27B Denseオープンウェイト	Qwen 3.6 35B A3B MoEオープンウェイト	DeepSeek V4 約1T MoE	DeepSeek V4 Pro 1.6T MoE
SWE-bench Verified 実際のソフトウェアエンジニアリング	78.8%	77.2%	73.4%	-	-
Terminal-Bench 2.0 ターミナル操作	61.6	59.3	51.5	-	-
SkillsBench 実践的コーディングスキル	-	48.2	-	-	-
LiveCodeBench 競技プログラミング	-	83.9	80.4	-	-
Claw-Eval Avg エンドツーエンドのエージェントコーディング	-	72.4	68.7	-	-
Context window 最大コンテキスト長	1Mトークン	128Kトークン	128Kトークン	1Mトークン	1Mトークン
Architecture モデルアーキテクチャ	プロプライエタリ	27B Dense	35B MoE（3Bアクティブ）	約1T MoE	1.6T MoE
preserve_thinking エージェント推論の永続化	対応	非対応	非対応	非対応	非対応
Open-weight ローカルデプロイ可能	非対応	対応（Apache 2.0）	対応（Apache 2.0）	未定	未定

Qwen 3.6データは公式リリース（2026年3月）より。DeepSeek V4データは初期ローンチレポート（2026年4月）より。一部のDeepSeek V4ベンチマークは完全な公開待ち。

Qwenエコシステム

実証済みのエージェント性能、今すぐ利用可能、業界最高水準の料金

Qwen 3.6は実証済みのベンチマーク、Apache 2.0のオープンウェイトモデル、エージェントワークフロー向けpreserve_thinking、$0.40/$2.40/百万トークンの料金で完全に利用可能です。ベンチマークを待つ必要はありません — 今すぐ構築を始めましょう。

Qwenモデルを探す公式ドキュメント

Qwen 3.6 Plus

SWE-bench 78.8%、$0.40/Mトークン

Plusを試す

Qwen 3.6 27B

SWE-bench 77.2%、オープンウェイト、Apache 2.0

27Bを試す

Qwen 3.6 35B A3B

SWE-bench 73.4%、コンシューマーGPU対応

35Bを試す

APIアクセス

OpenAI互換、preserve_thinking、無料枠あり

APIを見る

ローカル実行

Ollama、vLLM、llama.cpp、SGLang

始める

コミュニティ

Qwen開発者コミュニティに参加

参加する

Qwen 3.6を試す

ベンチマークを待つ必要なし — 実証済みのエージェント性能を今すぐ体験

Qwen 3.6はSWE-bench 78.8%、preserve_thinking、$0.40/$2.40/百万トークンで完全に利用可能です。無料でチャット、オープンウェイトモデルでローカルデプロイ、またはOpenAI互換APIで統合。Claude Code、OpenClaw、Aider、Continue.devと連携します。

チャットを始める APIドキュメント