Modelos Qwen 3.6
Quatro modelos, uma família - do Mac M4 16GB a desempenho de fronteira a $0.40/M de tokens
A família Qwen 3.6 abrange modelos proprietários alojados e lançamentos open-weight. O Plus entrega 78,8% no SWE-bench com contexto de 1M e preserve_thinking a $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6). O Max lida com raciocínio avançado e tarefas multimodais. O modelo denso 27B alcança 77,2% no SWE-bench e 48,2 no SkillsBench (superando o Claude 4.5 Opus). O 35B A3B MoE funciona no Mac M4 16GB com quantização Q3 a 20-40 tok/s. Todos os modelos partilham a mesma base de arquitetura e API compatível com OpenAI.
Família de modelos
Escolhe o modelo Qwen 3.6 certo para o teu caso de uso e orçamento
Desde implementação local leve num portátil até desempenho máximo alojado com contexto de 1M, a família Qwen 3.6 cobre cada escala, orçamento e cenário de implementação.
Proprietários
Modelos alojados com desempenho máximo e contexto de 1M
O Plus e o Max são modelos proprietários disponíveis via API. Oferecem o desempenho mais elevado, janelas de contexto de 1M, até 65.536 tokens de saída e funcionalidades como preserve_thinking exclusivas do nível alojado. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada - aproximadamente 12x mais baratos que o Claude Opus 4.6. Invocação em lote disponível a 50% do preço em tempo real.
Disponível via API compatível com OpenAI através do DashScope e OpenRouter (nível gratuito disponível)
Open-weight
Executa no teu próprio hardware com controlo total - licença Apache 2.0
Os modelos denso 27B e 35B A3B MoE são lançados sob a licença Apache 2.0. Implementa localmente com Ollama, vLLM, llama.cpp, SGLang ou KTransformers. O 27B cabe em 16GB de VRAM com IQ4_XS GGUF e compressão de cache KV. O 35B A3B funciona no Mac M4 16GB com quantização Q3. Sem custos por token, total privacidade de dados e liberdade para ajustar.
Disponível no HuggingFace, Ollama e repositórios GGUF
Qwen 3.6 Plus
Proprietário
Modelo proprietário principal com contexto de 1M, preserve_thinking para fluxos de trabalho agênticos e desempenho de topo. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Preços DashScope: $0.40 entrada / $2.40 saída por milhão de tokens, aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote com 50% de desconto. Até 65.536 tokens de saída por pedido.
Janela de contexto de 1M, parâmetro preserve_thinking, 65K tokens de saída, lote com 50% de desconto
Qwen 3.6 Max
Proprietário
Modelo proprietário de alto desempenho otimizado para raciocínio complexo, tarefas multimodais e compreensão de documentos. Forte em matemática, ciência, análise visual e processamento de documentos longos. Janela de contexto alargada com capacidades de raciocínio avançado para as tarefas analíticas mais exigentes.
Contexto alargado, capacidades multimodais, raciocínio avançado, compreensão de documentos
Qwen 3.6 27B
Open-weight
Modelo denso de 27B de parâmetros que entrega o melhor desempenho open-weight em programação. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Pode funcionar com 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV suportando contexto de 100K.
55,6GB FP16, 16GB de VRAM com IQ4_XS + compressão de cache KV, arquitetura densa, Apache 2.0
Qwen 3.6 35B A3B
Open-weight
Modelo MoE com 35B total / 3B de parâmetros ativos. Desempenho próximo do 27B numa pegada de GPU de consumo. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Funciona no Mac M4 16GB com quantização Q3 (~17GB). 20-40 tok/s em hardware de consumo a 4 bits. Visão e multimodal suportados.
~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B parâmetros ativos, 20-40 tok/s, Apache 2.0
Ecossistema Qwen
Uma família de modelos unificada para cada cenário de implementação e orçamento
Desde API na cloud a $0.40/M de tokens até implementação em portátil Mac M4, a família Qwen 3.6 proporciona qualidade consistente, interfaces compatíveis e relação preço-desempenho líder do setor em todos os alvos de implementação.
Começar
Pronto para explorar a família Qwen 3.6? Experimenta gratuitamente, implementa em qualquer lugar
Experimenta qualquer modelo Qwen 3.6 gratuitamente no navegador ou via nível gratuito do OpenRouter. Transfere modelos open-weight sob Apache 2.0 para executar no teu próprio hardware. Do Mac M4 16GB a servidores de produção, de API a $0.40/M de tokens a implementação local sem custos.