Modelli Qwen 3.6
Quattro modelli, una famiglia - dal Mac M4 16GB alle prestazioni di frontiera a $0,40/M token
La famiglia Qwen 3.6 comprende modelli proprietari hosted e rilasci open-weight. Plus offre 78,8% SWE-bench con contesto 1M e preserve_thinking a $0,40/$2,40 per milione di token (12 volte più economico di Claude Opus 4.6). Max gestisce ragionamento avanzato e attività multimodali. Il modello denso 27B raggiunge 77,2% SWE-bench e 48,2 SkillsBench (battendo Claude 4.5 Opus). Il 35B A3B MoE gira su Mac M4 16GB con quantizzazione Q3 a 20-40 tok/s. Ogni modello condivide la stessa base architetturale e l'API compatibile con OpenAI.
Famiglia di modelli
Scegli il modello Qwen 3.6 giusto per il tuo caso d'uso e budget
Dal deployment locale leggero su un laptop alle massime prestazioni hosted con contesto 1M, la famiglia Qwen 3.6 copre ogni scala, budget e scenario di deployment.
Proprietari
Modelli hosted con prestazioni massime e contesto 1M
Plus e Max sono modelli proprietari disponibili via API. Offrono le massime prestazioni, finestre di contesto da 1M, fino a 65.536 token di output e funzionalità come preserve_thinking esclusive del livello hosted. I prezzi DashScope partono da $0,40 per milione di token in input - circa 12 volte più economico di Claude Opus 4.6. Invocazione batch disponibile al 50% del prezzo in tempo reale.
Disponibili via API compatibile con OpenAI tramite DashScope e OpenRouter (livello gratuito disponibile)
Open-weight
Esegui sul tuo hardware con pieno controllo - licenza Apache 2.0
I modelli 27B denso e 35B A3B MoE sono rilasciati con licenza Apache 2.0. Deploy locale con Ollama, vLLM, llama.cpp, SGLang o KTransformers. Il 27B entra in 16GB VRAM con IQ4_XS GGUF e compressione KV cache. Il 35B A3B gira su Mac M4 16GB con quantizzazione Q3. Zero costi per token, piena privacy dei dati e libertà di fine-tuning.
Disponibili su HuggingFace, Ollama e repository GGUF
Qwen 3.6 Plus
Proprietario
Modello proprietario di punta con contesto 1M, preserve_thinking per flussi agentici e prestazioni di primo livello. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Prezzi DashScope: $0,40 input / $2,40 output per milione di token, circa 12 volte più economico di Claude Opus 4.6. Invocazione batch al 50%. Fino a 65.536 token di output per richiesta.
Finestra di contesto 1M, parametro preserve_thinking, 65K token di output, batch al 50%
Qwen 3.6 Max
Proprietario
Modello proprietario ad alte prestazioni ottimizzato per ragionamento complesso, attività multimodali e comprensione di documenti. Forte in matematica, scienze, analisi visiva ed elaborazione di documenti lunghi. Finestra di contesto estesa con capacità di ragionamento avanzato per le attività analitiche più impegnative.
Contesto esteso, capacità multimodali, ragionamento avanzato, comprensione documenti
Qwen 3.6 27B
Open-weight
Modello denso da 27B parametri che offre le migliori prestazioni open-weight nel coding. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (batte Claude 4.5 Opus a 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Può girare su 16GB VRAM usando IQ4_XS GGUF con compressione KV cache supportando contesto 100K.
55,6GB FP16, 16GB VRAM con IQ4_XS + compressione KV cache, architettura densa, Apache 2.0
Qwen 3.6 35B A3B
Open-weight
Modello MoE con 35B totali / 3B parametri attivi. Prestazioni vicine al 27B in un formato adatto a GPU consumer. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Gira su Mac M4 16GB con quantizzazione Q3 (~17GB). 20-40 tok/s su hardware consumer a 4 bit. Supporto visione e multimodale.
~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B parametri attivi, 20-40 tok/s, Apache 2.0
Ecosistema Qwen
Una famiglia di modelli unificata per ogni scenario di deployment e budget
Dall'API cloud a $0,40/M token al deployment su laptop Mac M4, la famiglia Qwen 3.6 offre qualità costante, interfacce compatibili e un rapporto prezzo-prestazioni leader del settore su tutti i target di deployment.
Inizia
Pronto a esplorare la famiglia Qwen 3.6? Prova gratis, esegui ovunque
Prova qualsiasi modello Qwen 3.6 gratis nel browser o tramite il livello gratuito di OpenRouter. Scarica i modelli open-weight con licenza Apache 2.0 per eseguirli sul tuo hardware. Dal Mac M4 16GB ai server di produzione, dall'API a $0,40/M token al deployment locale a costo zero.