Modelli Qwen 3.6

Quattro modelli, una famiglia - dal Mac M4 16GB alle prestazioni di frontiera a $0,40/M token

La famiglia Qwen 3.6 comprende modelli proprietari hosted e rilasci open-weight. Plus offre 78,8% SWE-bench con contesto 1M e preserve_thinking a $0,40/$2,40 per milione di token (12 volte più economico di Claude Opus 4.6). Max gestisce ragionamento avanzato e attività multimodali. Il modello denso 27B raggiunge 77,2% SWE-bench e 48,2 SkillsBench (battendo Claude 4.5 Opus). Il 35B A3B MoE gira su Mac M4 16GB con quantizzazione Q3 a 20-40 tok/s. Ogni modello condivide la stessa base architetturale e l'API compatibile con OpenAI.

Famiglia di modelli

Scegli il modello Qwen 3.6 giusto per il tuo caso d'uso e budget

Dal deployment locale leggero su un laptop alle massime prestazioni hosted con contesto 1M, la famiglia Qwen 3.6 copre ogni scala, budget e scenario di deployment.

Proprietari

Modelli hosted con prestazioni massime e contesto 1M

Plus e Max sono modelli proprietari disponibili via API. Offrono le massime prestazioni, finestre di contesto da 1M, fino a 65.536 token di output e funzionalità come preserve_thinking esclusive del livello hosted. I prezzi DashScope partono da $0,40 per milione di token in input - circa 12 volte più economico di Claude Opus 4.6. Invocazione batch disponibile al 50% del prezzo in tempo reale.

Disponibili via API compatibile con OpenAI tramite DashScope e OpenRouter (livello gratuito disponibile)

Open-weight

Esegui sul tuo hardware con pieno controllo - licenza Apache 2.0

I modelli 27B denso e 35B A3B MoE sono rilasciati con licenza Apache 2.0. Deploy locale con Ollama, vLLM, llama.cpp, SGLang o KTransformers. Il 27B entra in 16GB VRAM con IQ4_XS GGUF e compressione KV cache. Il 35B A3B gira su Mac M4 16GB con quantizzazione Q3. Zero costi per token, piena privacy dei dati e libertà di fine-tuning.

Disponibili su HuggingFace, Ollama e repository GGUF

Qwen 3.6 Plus

Proprietario

Modello proprietario di punta con contesto 1M, preserve_thinking per flussi agentici e prestazioni di primo livello. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Prezzi DashScope: $0,40 input / $2,40 output per milione di token, circa 12 volte più economico di Claude Opus 4.6. Invocazione batch al 50%. Fino a 65.536 token di output per richiesta.

Finestra di contesto 1M, parametro preserve_thinking, 65K token di output, batch al 50%

Accesso API via DashScope e OpenRouter (livello gratuito disponibile)

Qwen 3.6 Max

Proprietario

Modello proprietario ad alte prestazioni ottimizzato per ragionamento complesso, attività multimodali e comprensione di documenti. Forte in matematica, scienze, analisi visiva ed elaborazione di documenti lunghi. Finestra di contesto estesa con capacità di ragionamento avanzato per le attività analitiche più impegnative.

Contesto esteso, capacità multimodali, ragionamento avanzato, comprensione documenti

Accesso API via DashScope e OpenRouter

Qwen 3.6 27B

Open-weight

Modello denso da 27B parametri che offre le migliori prestazioni open-weight nel coding. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (batte Claude 4.5 Opus a 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Può girare su 16GB VRAM usando IQ4_XS GGUF con compressione KV cache supportando contesto 100K.

55,6GB FP16, 16GB VRAM con IQ4_XS + compressione KV cache, architettura densa, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), download GGUF

Qwen 3.6 35B A3B

Open-weight

Modello MoE con 35B totali / 3B parametri attivi. Prestazioni vicine al 27B in un formato adatto a GPU consumer. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Gira su Mac M4 16GB con quantizzazione Q3 (~17GB). 20-40 tok/s su hardware consumer a 4 bit. Supporto visione e multimodale.

~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B parametri attivi, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), download GGUF

Ecosistema Qwen

Una famiglia di modelli unificata per ogni scenario di deployment e budget

Dall'API cloud a $0,40/M token al deployment su laptop Mac M4, la famiglia Qwen 3.6 offre qualità costante, interfacce compatibili e un rapporto prezzo-prestazioni leader del settore su tutti i target di deployment.

Qwen 3.6 Plus

78,8% SWE-bench, contesto 1M, $0,40/M token

Prova Plus

Qwen 3.6 Max

Ragionamento avanzato e multimodale

Prova Max

Qwen 3.6 27B

77,2% SWE-bench, batte Claude su SkillsBench

Prova il 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, adatto a Mac M4 16GB

Prova il 35B

Riferimento API

Endpoint compatibili con OpenAI, preserve_thinking

Vedi API

Community

Unisciti alla community degli sviluppatori Qwen

Unisciti

Inizia

Pronto a esplorare la famiglia Qwen 3.6? Prova gratis, esegui ovunque

Prova qualsiasi modello Qwen 3.6 gratis nel browser o tramite il livello gratuito di OpenRouter. Scarica i modelli open-weight con licenza Apache 2.0 per eseguirli sul tuo hardware. Dal Mac M4 16GB ai server di produzione, dall'API a $0,40/M token al deployment locale a costo zero.