モデルバリエーション
ローカルおよびクラウドデプロイ向けオープンウェイトMoE
Qwen 3.6 35B A3Bは、最小限のアクティブパラメータで高い性能を発揮します。チャットやコーディング向けのインストラクションチューニング済みモデル、またはファインチューニング向けのベースモデルからお選びいただけます。
Mixture-of-Expertsアーキテクチャ
総パラメータ35B、トークンあたり3Bがアクティブ、256エキスパート
Qwen 3.6 35B A3Bは、Hybrid Gated DeltaNet + Gated Attention + MoE設計を採用し、256のエキスパートからトークンあたり8つのルーティングエキスパートと1つの共有エキスパートを使用します。262Kネイティブコンテキストは最大1Mトークンまで拡張可能で、Apache 2.0ライセンスにより無制限の商用利用が可能です。
トークンあたり3Bのアクティブパラメータのみで、はるかに大きなデンスモデルに匹敵する性能を維持しながら、コンシューマーGPUで効率的に動作します。
インストラクションチューニング済み
35B A3B Instruct
コンシューマーハードウェアでの対話型AI、コーディング、エージェントタスクに最適化
MoE効率性を活かした指示追従とマルチターン対話のファインチューニング済み
事前学習済み
35B A3B Base
ファインチューニングや専門用途向けの基盤MoEモデル
256エキスパートMoEルーティングを用いた多様なデータで事前学習済み
機能
256エキスパート、3Bアクティブ - 最大効率と高性能の両立
Qwen 3.6 35B A3Bは、大規模なエキスパートプールと最小限のアクティブ計算を組み合わせ、コンシューマー向けハードウェアで優れたコーディング、推論、エージェント機能を実現します。
実世界のソフトウェアエンジニアリング
SWE-bench Verifiedで73.4%を達成。トークンあたり3Bのアクティブパラメータのみで実際のGitHub Issueを解決します。推論時に10倍の計算量を使用するモデルと競合する性能です。
ターミナル操作
Terminal-Bench 2.0で51.5を達成。複雑なマルチステップのターミナルワークフローに対応し、デバッグ、システム管理、ビルドパイプラインタスクを高い習熟度で処理します。
高度な数学
AIME 2026で92.7%を達成。コンシューマーGPUで動作するモデルとしては最先端に近い数学推論能力です。ステップバイステップの思考モードにより透明な問題解決が可能です。
262Kから1Mコンテキスト
262Kネイティブコンテキストウィンドウは最大1Mトークンまで拡張可能。コードベース全体、長文ドキュメント、複雑なマルチターン会話を切り捨てなしで分析できます。
競技プログラミング
LiveCodeBench v6で80.4を達成。アルゴリズム問題の解決に優れ、複数のプログラミング言語にわたるコード生成、デバッグ、リファクタリング能力を備えています。
オープンウェイトの自由
Apache 2.0ライセンスにより、無制限の商用利用、ファインチューニング、再配布が可能です。研究やカスタマイズのためのモデル重みへの完全なアクセスを提供します。
主なハイライト
コンシューマーハードウェアで最先端MoE性能を
Qwen 3.6 35B A3Bは、トークンあたり3Bのパラメータのみを活性化しながら、コーディング、推論、エージェントベンチマークで優れた結果を達成しています。
主な実績
- SWE-bench Verified: 73.4% - 実世界のソフトウェアエンジニアリング
- Terminal-Bench 2.0: 51.5 - 複雑なターミナル操作
- AIME 2026: 92.7% - 高度な数学
- LiveCodeBench v6: 80.4 - 競技プログラミング
- Apache 2.0ライセンス - 完全オープンウェイト
技術仕様
- 総パラメータ35B、トークンあたり3Bがアクティブ
- 256エキスパート: トークンあたり8つのルーティング + 1つの共有がアクティブ
- Hybrid Gated DeltaNet + Gated Attention + MoEアーキテクチャ
- 262Kネイティブコンテキスト、最大1Mトークンまで拡張可能
- コンシューマーGPUでローカル実行可能
パフォーマンス
3Bアクティブの推論コストで高いMoE性能を
Qwen 3.6 35B A3Bは、SWE-bench Verifiedで73.4%、AIME 2026で92.7%を達成。トークンあたり3Bのパラメータのみを活性化し、最先端クラスの能力をコンシューマーハードウェアで実現します。
Qwen 3.6 35B A3Bは、256エキスパートのスパースMoEアーキテクチャが、計算コストのごく一部で、ソフトウェアエンジニアリング、数学、競技プログラミングにおいて優れた結果を達成できることを実証しています。


SWE-bench Verified: 73.4% トークンあたり3Bのアクティブパラメータのみ
Terminal-Bench 2.0: 51.5 ターミナル操作
AIME 2026: 92.7% 高度な数学
LiveCodeBench v6: 80.4 競技プログラミング
Apache 2.0オープンウェイトライセンス
ベンチマーク比較
Qwen 3.6 35B A3B vs Qwen 3.6ファミリーおよび競合モデル
Qwen 3.6 35B A3Bは、最小限の推論コストで、ソフトウェアエンジニアリング、ターミナル操作、推論ベンチマークにおいて高い性能を発揮します。
| Benchmark | Qwen 3.6 35B A3B MoE 注目 | Qwen 3.6 27B デンス | Qwen 3.6 Plus プロプライエタリ | Qwen 3 235B A22B MoE |
|---|---|---|---|---|
SWE-bench Verified 実世界のソフトウェアエンジニアリング | 73.4% | 77.2% | 78.8% | 76.2% |
Terminal-Bench 2.0 ターミナル操作 | 51.5 | 59.3 | 61.6 | - |
AIME 2026 数学 No tools | 92.7% | 94.1% | - | - |
LiveCodeBench v6 競技プログラミング | 80.4 | 83.9 | - | - |
ベンチマーク結果はQwen 3.6公式モデルカードおよびHuggingFace評価より。
256エキスパートMoE
35Bの容量、3Bの推論コスト - コンシューマーGPUで動作
Mixture-of-Experts設計により、各トークンは256のエキスパートのうち8つと1つの共有エキスパートを経由します。全35Bパラメータがルーティングの多様性のためにロードされますが、フォワードパスごとに活性化されるのは3Bのみ。Hybrid Gated DeltaNet + Gated Attentionアーキテクチャと組み合わせることで、コンシューマーGPUでのデプロイと高い性能を両立します。
- 総容量35Bからトークンあたり3Bのアクティブパラメータ
- 256エキスパート: トークンあたり8つのルーティング + 1つの共有がアクティブ
- 量子化によりコンシューマーGPUでローカル実行可能

オープンウェイト
Apache 2.0 - 商用利用とファインチューニングに完全対応
Qwen 3.6 35B A3Bは、Apache 2.0ライセンスの下でリリースされており、無制限の商用デプロイ、ファインチューニング、再配布が可能です。HuggingFaceから重みをダウンロードし、お手持ちのインフラで完全にコントロールしてデプロイできます。
- Apache 2.0ライセンス - 使用制限なし
- ファインチューニングとカスタマイズのための完全な重みアクセス
- 幅広いフレームワークサポートを持つコミュニティ主導のエコシステム
はじめに
Qwen 3.6 35B A3Bを今すぐ試す
すぐにチャットを開始するか、セルフホスト環境向けにオープンウェイトモデルをダウンロードできます。
ローカルデプロイ
お手持ちのハードウェアで実行
量子化重みでコンシューマーGPUにローカルデプロイ。Apache 2.0ライセンスで無制限に利用可能。
Qwenエコシステム
Qwen 3.6モデルファミリーの一員
Qwen 3.6 35B A3Bは、Alibabaの最新モデルファミリーにおけるオープンウェイトMoEバリエーションで、コンシューマーハードウェアでの最大限のアクセシビリティを目指して設計されています。
はじめに
Qwen 3.6 35B A3Bで構築を始めませんか?
無料ですぐにチャットを開始するか、Apache 2.0のオープンウェイトモデルをダウンロードしてコンシューマーハードウェアでセルフホストデプロイできます。