Modelos Qwen 3.6
Quatro modelos, uma família - do Mac M4 16GB ao desempenho de fronteira a $0.40/M de tokens
A família Qwen 3.6 abrange modelos proprietários hospedados e lançamentos open-weight. O Plus entrega 78,8% SWE-bench com contexto de 1M e preserve_thinking a $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6). O Max lida com raciocínio avançado e tarefas multimodais. O modelo denso 27B alcança 77,2% SWE-bench e 48,2 SkillsBench (superando o Claude 4.5 Opus). O 35B A3B MoE roda no Mac M4 16GB com quantização Q3 a 20-40 tok/s. Todos os modelos compartilham a mesma base de arquitetura e API compatível com OpenAI.
Família de modelos
Escolha o modelo Qwen 3.6 certo para seu caso de uso e orçamento
De implantação local leve em um laptop a desempenho máximo hospedado com contexto de 1M, a família Qwen 3.6 cobre cada escala, orçamento e cenário de implantação.
Proprietário
Modelos hospedados com desempenho máximo e contexto de 1M
Plus e Max são modelos proprietários disponíveis via API. Oferecem o maior desempenho, janelas de contexto de 1M, até 65.536 tokens de saída e recursos como preserve_thinking exclusivos do nível hospedado. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada - aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote disponível com 50% do preço em tempo real.
Disponível via API compatível com OpenAI pelo DashScope e OpenRouter (nível gratuito disponível)
Open-weight
Execute no seu próprio hardware com controle total - licenciado sob Apache 2.0
Os modelos denso 27B e 35B A3B MoE são lançados sob a licença Apache 2.0. Implante localmente com Ollama, vLLM, llama.cpp, SGLang ou KTransformers. O 27B cabe em 16GB de VRAM com IQ4_XS GGUF e compressão de cache KV. O 35B A3B roda no Mac M4 16GB com quantização Q3. Custo por token zero, privacidade total dos dados e liberdade para ajuste fino.
Disponível no HuggingFace, Ollama e repositórios GGUF
Qwen 3.6 Plus
Proprietário
Modelo proprietário principal com contexto de 1M, preserve_thinking para fluxos agênticos e desempenho de ponta. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Preços DashScope: $0.40 entrada / $2.40 saída por milhão de tokens, aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote com 50% de desconto. Até 65.536 tokens de saída por requisição.
Janela de contexto de 1M, parâmetro preserve_thinking, 65K tokens de saída, lote com 50% de desconto
Qwen 3.6 Max
Proprietário
Modelo proprietário de alto desempenho otimizado para raciocínio complexo, tarefas multimodais e compreensão de documentos. Forte em matemática, ciência, análise visual e processamento de documentos longos. Janela de contexto estendida com capacidades avançadas de raciocínio para as tarefas analíticas mais exigentes.
Contexto estendido, capacidades multimodais, raciocínio avançado, compreensão de documentos
Qwen 3.6 27B
Open-weight
Modelo denso de 27B de parâmetros entregando o melhor desempenho open-weight em programação. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Pode rodar em 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV suportando contexto de 100K.
55,6GB FP16, 16GB de VRAM com IQ4_XS + compressão de cache KV, arquitetura densa, Apache 2.0
Qwen 3.6 35B A3B
Open-weight
Modelo MoE com 35B total / 3B de parâmetros ativos. Desempenho próximo ao 27B em um footprint de GPU de consumo. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Roda no Mac M4 16GB com quantização Q3 (~17GB). 20-40 tok/s em hardware de consumo com 4-bit. Visão e multimodal suportados.
~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B de parâmetros ativos, 20-40 tok/s, Apache 2.0
Ecossistema Qwen
Uma família de modelos unificada para cada cenário de implantação e orçamento
Da API na nuvem a $0.40/M de tokens à implantação em laptop Mac M4, a família Qwen 3.6 oferece qualidade consistente, interfaces compatíveis e custo-benefício líder do setor em todos os alvos de implantação.
Comece agora
Pronto para explorar a família Qwen 3.6? Experimente grátis, implante em qualquer lugar
Experimente qualquer modelo Qwen 3.6 gratuitamente no navegador ou pelo nível gratuito do OpenRouter. Baixe modelos open-weight sob Apache 2.0 para executar no seu próprio hardware. Do Mac M4 16GB a servidores de produção, da API a $0.40/M de tokens à implantação local sem custo.