Qwen 3.6 35B A3B

350億パラメータ、30億がアクティブ - コンシューマーハードウェアで最先端MoEを

Qwen 3.6 35B A3Bは、256のエキスパートからトークンあたり3Bのパラメータのみを活性化するMixture-of-Expertsモデルです。SWE-bench Verifiedで73.4%、AIME 2026で92.7%を達成し、Apache 2.0ライセンスにより、最先端クラスのコーディングと推論能力をコンシューマーGPUで利用可能にします。

チャットを始めるベンチマークを見る

モデルバリエーション

ローカルおよびクラウドデプロイ向けオープンウェイトMoE

Qwen 3.6 35B A3Bは、最小限のアクティブパラメータで高い性能を発揮します。チャットやコーディング向けのインストラクションチューニング済みモデル、またはファインチューニング向けのベースモデルからお選びいただけます。

Mixture-of-Expertsアーキテクチャ

総パラメータ35B、トークンあたり3Bがアクティブ、256エキスパート

Qwen 3.6 35B A3Bは、Hybrid Gated DeltaNet + Gated Attention + MoE設計を採用し、256のエキスパートからトークンあたり8つのルーティングエキスパートと1つの共有エキスパートを使用します。262Kネイティブコンテキストは最大1Mトークンまで拡張可能で、Apache 2.0ライセンスにより無制限の商用利用が可能です。

トークンあたり3Bのアクティブパラメータのみで、はるかに大きなデンスモデルに匹敵する性能を維持しながら、コンシューマーGPUで効率的に動作します。

チャットを始める機能を見る

インストラクションチューニング済み

35B A3B Instruct

コンシューマーハードウェアでの対話型AI、コーディング、エージェントタスクに最適化

MoE効率性を活かした指示追従とマルチターン対話のファインチューニング済み

提供中 - Apache 2.0

チャットを始める重みをダウンロード

事前学習済み

35B A3B Base

ファインチューニングや専門用途向けの基盤MoEモデル

256エキスパートMoEルーティングを用いた多様なデータで事前学習済み

提供中 - Apache 2.0

HuggingFaceで見るファインチューニングガイド

機能

256エキスパート、3Bアクティブ - 最大効率と高性能の両立

Qwen 3.6 35B A3Bは、大規模なエキスパートプールと最小限のアクティブ計算を組み合わせ、コンシューマー向けハードウェアで優れたコーディング、推論、エージェント機能を実現します。

実世界のソフトウェアエンジニアリング

SWE-bench Verifiedで73.4%を達成。トークンあたり3Bのアクティブパラメータのみで実際のGitHub Issueを解決します。推論時に10倍の計算量を使用するモデルと競合する性能です。

ターミナル操作

Terminal-Bench 2.0で51.5を達成。複雑なマルチステップのターミナルワークフローに対応し、デバッグ、システム管理、ビルドパイプラインタスクを高い習熟度で処理します。

高度な数学

AIME 2026で92.7%を達成。コンシューマーGPUで動作するモデルとしては最先端に近い数学推論能力です。ステップバイステップの思考モードにより透明な問題解決が可能です。

262Kから1Mコンテキスト

262Kネイティブコンテキストウィンドウは最大1Mトークンまで拡張可能。コードベース全体、長文ドキュメント、複雑なマルチターン会話を切り捨てなしで分析できます。

競技プログラミング

LiveCodeBench v6で80.4を達成。アルゴリズム問題の解決に優れ、複数のプログラミング言語にわたるコード生成、デバッグ、リファクタリング能力を備えています。

オープンウェイトの自由

Apache 2.0ライセンスにより、無制限の商用利用、ファインチューニング、再配布が可能です。研究やカスタマイズのためのモデル重みへの完全なアクセスを提供します。

主なハイライト

コンシューマーハードウェアで最先端MoE性能を

Qwen 3.6 35B A3Bは、トークンあたり3Bのパラメータのみを活性化しながら、コーディング、推論、エージェントベンチマークで優れた結果を達成しています。

主な実績

SWE-bench Verified: 73.4% - 実世界のソフトウェアエンジニアリング
Terminal-Bench 2.0: 51.5 - 複雑なターミナル操作
AIME 2026: 92.7% - 高度な数学
LiveCodeBench v6: 80.4 - 競技プログラミング
Apache 2.0ライセンス - 完全オープンウェイト

技術仕様

総パラメータ35B、トークンあたり3Bがアクティブ
256エキスパート: トークンあたり8つのルーティング + 1つの共有がアクティブ
Hybrid Gated DeltaNet + Gated Attention + MoEアーキテクチャ
262Kネイティブコンテキスト、最大1Mトークンまで拡張可能
コンシューマーGPUでローカル実行可能

無料でチャットを始める重みをダウンロード

パフォーマンス

3Bアクティブの推論コストで高いMoE性能を

Qwen 3.6 35B A3Bは、SWE-bench Verifiedで73.4%、AIME 2026で92.7%を達成。トークンあたり3Bのパラメータのみを活性化し、最先端クラスの能力をコンシューマーハードウェアで実現します。

Qwen 3.6 35B A3Bは、256エキスパートのスパースMoEアーキテクチャが、計算コストのごく一部で、ソフトウェアエンジニアリング、数学、競技プログラミングにおいて優れた結果を達成できることを実証しています。

チャットを始めるモデルカードを見る

Qwen 3.6 35B A3B コーディングおよび推論ベンチマークのパフォーマンス比較チャート

SWE-bench Verified: 73.4% トークンあたり3Bのアクティブパラメータのみ

Terminal-Bench 2.0: 51.5 ターミナル操作

AIME 2026: 92.7% 高度な数学

LiveCodeBench v6: 80.4 競技プログラミング

Apache 2.0オープンウェイトライセンス

ベンチマーク比較

Qwen 3.6 35B A3B vs Qwen 3.6ファミリーおよび競合モデル

Qwen 3.6 35B A3Bは、最小限の推論コストで、ソフトウェアエンジニアリング、ターミナル操作、推論ベンチマークにおいて高い性能を発揮します。

Benchmark	Qwen 3.6 35B A3B MoE 注目	Qwen 3.6 27B デンス	Qwen 3.6 Plus プロプライエタリ	Qwen 3 235B A22B MoE
SWE-bench Verified 実世界のソフトウェアエンジニアリング	73.4%	77.2%	78.8%	76.2%
Terminal-Bench 2.0 ターミナル操作	51.5	59.3	61.6	-
AIME 2026 数学 No tools	92.7%	94.1%	-	-
LiveCodeBench v6 競技プログラミング	80.4	83.9	-	-

ベンチマーク結果はQwen 3.6公式モデルカードおよびHuggingFace評価より。

256エキスパートMoE

35Bの容量、3Bの推論コスト - コンシューマーGPUで動作

Mixture-of-Experts設計により、各トークンは256のエキスパートのうち8つと1つの共有エキスパートを経由します。全35Bパラメータがルーティングの多様性のためにロードされますが、フォワードパスごとに活性化されるのは3Bのみ。Hybrid Gated DeltaNet + Gated Attentionアーキテクチャと組み合わせることで、コンシューマーGPUでのデプロイと高い性能を両立します。