Qwen 3.6 35B A3B

350億パラメータ、30億がアクティブ - コンシューマーハードウェアで最先端MoEを

Qwen 3.6 35B A3Bは、256のエキスパートからトークンあたり3Bのパラメータのみを活性化するMixture-of-Expertsモデルです。SWE-bench Verifiedで73.4%、AIME 2026で92.7%を達成し、Apache 2.0ライセンスにより、最先端クラスのコーディングと推論能力をコンシューマーGPUで利用可能にします。

モデルバリエーション

ローカルおよびクラウドデプロイ向けオープンウェイトMoE

Qwen 3.6 35B A3Bは、最小限のアクティブパラメータで高い性能を発揮します。チャットやコーディング向けのインストラクションチューニング済みモデル、またはファインチューニング向けのベースモデルからお選びいただけます。

Mixture-of-Expertsアーキテクチャ

総パラメータ35B、トークンあたり3Bがアクティブ、256エキスパート

Qwen 3.6 35B A3Bは、Hybrid Gated DeltaNet + Gated Attention + MoE設計を採用し、256のエキスパートからトークンあたり8つのルーティングエキスパートと1つの共有エキスパートを使用します。262Kネイティブコンテキストは最大1Mトークンまで拡張可能で、Apache 2.0ライセンスにより無制限の商用利用が可能です。

トークンあたり3Bのアクティブパラメータのみで、はるかに大きなデンスモデルに匹敵する性能を維持しながら、コンシューマーGPUで効率的に動作します。

インストラクションチューニング済み

35B A3B Instruct

コンシューマーハードウェアでの対話型AI、コーディング、エージェントタスクに最適化

MoE効率性を活かした指示追従とマルチターン対話のファインチューニング済み

提供中 - Apache 2.0

事前学習済み

35B A3B Base

ファインチューニングや専門用途向けの基盤MoEモデル

256エキスパートMoEルーティングを用いた多様なデータで事前学習済み

提供中 - Apache 2.0

機能

256エキスパート、3Bアクティブ - 最大効率と高性能の両立

Qwen 3.6 35B A3Bは、大規模なエキスパートプールと最小限のアクティブ計算を組み合わせ、コンシューマー向けハードウェアで優れたコーディング、推論、エージェント機能を実現します。

実世界のソフトウェアエンジニアリング

SWE-bench Verifiedで73.4%を達成。トークンあたり3Bのアクティブパラメータのみで実際のGitHub Issueを解決します。推論時に10倍の計算量を使用するモデルと競合する性能です。

ターミナル操作

Terminal-Bench 2.0で51.5を達成。複雑なマルチステップのターミナルワークフローに対応し、デバッグ、システム管理、ビルドパイプラインタスクを高い習熟度で処理します。

高度な数学

AIME 2026で92.7%を達成。コンシューマーGPUで動作するモデルとしては最先端に近い数学推論能力です。ステップバイステップの思考モードにより透明な問題解決が可能です。

262Kから1Mコンテキスト

262Kネイティブコンテキストウィンドウは最大1Mトークンまで拡張可能。コードベース全体、長文ドキュメント、複雑なマルチターン会話を切り捨てなしで分析できます。

競技プログラミング

LiveCodeBench v6で80.4を達成。アルゴリズム問題の解決に優れ、複数のプログラミング言語にわたるコード生成、デバッグ、リファクタリング能力を備えています。

オープンウェイトの自由

Apache 2.0ライセンスにより、無制限の商用利用、ファインチューニング、再配布が可能です。研究やカスタマイズのためのモデル重みへの完全なアクセスを提供します。

主なハイライト

コンシューマーハードウェアで最先端MoE性能を

Qwen 3.6 35B A3Bは、トークンあたり3Bのパラメータのみを活性化しながら、コーディング、推論、エージェントベンチマークで優れた結果を達成しています。

主な実績

  • SWE-bench Verified: 73.4% - 実世界のソフトウェアエンジニアリング
  • Terminal-Bench 2.0: 51.5 - 複雑なターミナル操作
  • AIME 2026: 92.7% - 高度な数学
  • LiveCodeBench v6: 80.4 - 競技プログラミング
  • Apache 2.0ライセンス - 完全オープンウェイト

技術仕様

  • 総パラメータ35B、トークンあたり3Bがアクティブ
  • 256エキスパート: トークンあたり8つのルーティング + 1つの共有がアクティブ
  • Hybrid Gated DeltaNet + Gated Attention + MoEアーキテクチャ
  • 262Kネイティブコンテキスト、最大1Mトークンまで拡張可能
  • コンシューマーGPUでローカル実行可能

パフォーマンス

3Bアクティブの推論コストで高いMoE性能を

Qwen 3.6 35B A3Bは、SWE-bench Verifiedで73.4%、AIME 2026で92.7%を達成。トークンあたり3Bのパラメータのみを活性化し、最先端クラスの能力をコンシューマーハードウェアで実現します。

Qwen 3.6 35B A3Bは、256エキスパートのスパースMoEアーキテクチャが、計算コストのごく一部で、ソフトウェアエンジニアリング、数学、競技プログラミングにおいて優れた結果を達成できることを実証しています。

Qwen 3.6 35B A3B コーディングおよび推論ベンチマークのパフォーマンス比較チャート

SWE-bench Verified: 73.4% トークンあたり3Bのアクティブパラメータのみ

Terminal-Bench 2.0: 51.5 ターミナル操作

AIME 2026: 92.7% 高度な数学

LiveCodeBench v6: 80.4 競技プログラミング

Apache 2.0オープンウェイトライセンス

ベンチマーク比較

Qwen 3.6 35B A3B vs Qwen 3.6ファミリーおよび競合モデル

Qwen 3.6 35B A3Bは、最小限の推論コストで、ソフトウェアエンジニアリング、ターミナル操作、推論ベンチマークにおいて高い性能を発揮します。

Benchmark
Qwen 3.6 35B A3B
MoE
注目
Qwen 3.6 27B
デンス
Qwen 3.6 Plus
プロプライエタリ
Qwen 3 235B A22B
MoE
SWE-bench Verified
実世界のソフトウェアエンジニアリング
73.4%77.2%78.8%76.2%
Terminal-Bench 2.0
ターミナル操作
51.559.361.6-
AIME 2026
数学
No tools
92.7%94.1%--
LiveCodeBench v6
競技プログラミング
80.483.9--

ベンチマーク結果はQwen 3.6公式モデルカードおよびHuggingFace評価より。

256エキスパートMoE

35Bの容量、3Bの推論コスト - コンシューマーGPUで動作

Mixture-of-Experts設計により、各トークンは256のエキスパートのうち8つと1つの共有エキスパートを経由します。全35Bパラメータがルーティングの多様性のためにロードされますが、フォワードパスごとに活性化されるのは3Bのみ。Hybrid Gated DeltaNet + Gated Attentionアーキテクチャと組み合わせることで、コンシューマーGPUでのデプロイと高い性能を両立します。

  • 総容量35Bからトークンあたり3Bのアクティブパラメータ
  • 256エキスパート: トークンあたり8つのルーティング + 1つの共有がアクティブ
  • 量子化によりコンシューマーGPUでローカル実行可能
35Bの容量、3Bの推論コスト - コンシューマーGPUで動作

オープンウェイト

Apache 2.0 - 商用利用とファインチューニングに完全対応

Qwen 3.6 35B A3Bは、Apache 2.0ライセンスの下でリリースされており、無制限の商用デプロイ、ファインチューニング、再配布が可能です。HuggingFaceから重みをダウンロードし、お手持ちのインフラで完全にコントロールしてデプロイできます。

  • Apache 2.0ライセンス - 使用制限なし
  • ファインチューニングとカスタマイズのための完全な重みアクセス
  • 幅広いフレームワークサポートを持つコミュニティ主導のエコシステム

ローカルデプロイ

お手持ちのハードウェアで実行

量子化重みでコンシューマーGPUにローカルデプロイ。Apache 2.0ライセンスで無制限に利用可能。

Qwenエコシステム

Qwen 3.6モデルファミリーの一員

Qwen 3.6 35B A3Bは、Alibabaの最新モデルファミリーにおけるオープンウェイトMoEバリエーションで、コンシューマーハードウェアでの最大限のアクセシビリティを目指して設計されています。

ドキュメント

統合とデプロイの完全ガイド

ドキュメントを読む

HuggingFace

Apache 2.0重みのダウンロードとモデルハブの探索

ダウンロード

モデルカード

技術仕様と評価結果

詳細を見る

GitHubリポジトリ

ソースコード、サンプル、コミュニティの貢献

コードを見る

APIアクセス

クラウドデプロイ向けOpenAI互換APIエンドポイント

はじめる

コミュニティ

Qwen開発者コミュニティに参加

参加する

はじめに

Qwen 3.6 35B A3Bで構築を始めませんか?

無料ですぐにチャットを開始するか、Apache 2.0のオープンウェイトモデルをダウンロードしてコンシューマーハードウェアでセルフホストデプロイできます。