Modelos Qwen 3.6

Quatro modelos, uma família - do Mac M4 16GB a desempenho de fronteira a $0.40/M de tokens

A família Qwen 3.6 abrange modelos proprietários alojados e lançamentos open-weight. O Plus entrega 78,8% no SWE-bench com contexto de 1M e preserve_thinking a $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6). O Max lida com raciocínio avançado e tarefas multimodais. O modelo denso 27B alcança 77,2% no SWE-bench e 48,2 no SkillsBench (superando o Claude 4.5 Opus). O 35B A3B MoE funciona no Mac M4 16GB com quantização Q3 a 20-40 tok/s. Todos os modelos partilham a mesma base de arquitetura e API compatível com OpenAI.

Começar a Conversar Comparar modelos

Família de modelos

Escolhe o modelo Qwen 3.6 certo para o teu caso de uso e orçamento

Desde implementação local leve num portátil até desempenho máximo alojado com contexto de 1M, a família Qwen 3.6 cobre cada escala, orçamento e cenário de implementação.

Proprietários

Modelos alojados com desempenho máximo e contexto de 1M

O Plus e o Max são modelos proprietários disponíveis via API. Oferecem o desempenho mais elevado, janelas de contexto de 1M, até 65.536 tokens de saída e funcionalidades como preserve_thinking exclusivas do nível alojado. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada - aproximadamente 12x mais baratos que o Claude Opus 4.6. Invocação em lote disponível a 50% do preço em tempo real.

Disponível via API compatível com OpenAI através do DashScope e OpenRouter (nível gratuito disponível)

Ver preços da API

Open-weight

Executa no teu próprio hardware com controlo total - licença Apache 2.0

Os modelos denso 27B e 35B A3B MoE são lançados sob a licença Apache 2.0. Implementa localmente com Ollama, vLLM, llama.cpp, SGLang ou KTransformers. O 27B cabe em 16GB de VRAM com IQ4_XS GGUF e compressão de cache KV. O 35B A3B funciona no Mac M4 16GB com quantização Q3. Sem custos por token, total privacidade de dados e liberdade para ajustar.

Disponível no HuggingFace, Ollama e repositórios GGUF

Qwen 3.6 Plus

Proprietário

Modelo proprietário principal com contexto de 1M, preserve_thinking para fluxos de trabalho agênticos e desempenho de topo. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Preços DashScope: $0.40 entrada / $2.40 saída por milhão de tokens, aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote com 50% de desconto. Até 65.536 tokens de saída por pedido.

Janela de contexto de 1M, parâmetro preserve_thinking, 65K tokens de saída, lote com 50% de desconto

Acesso API via DashScope e OpenRouter (nível gratuito de pré-visualização disponível)

Experimentar Plus Documentação API

Qwen 3.6 Max

Proprietário

Modelo proprietário de alto desempenho otimizado para raciocínio complexo, tarefas multimodais e compreensão de documentos. Forte em matemática, ciência, análise visual e processamento de documentos longos. Janela de contexto alargada com capacidades de raciocínio avançado para as tarefas analíticas mais exigentes.

Contexto alargado, capacidades multimodais, raciocínio avançado, compreensão de documentos

Acesso API via DashScope e OpenRouter

Experimentar Max Documentação API

Qwen 3.6 27B

Open-weight

Modelo denso de 27B de parâmetros que entrega o melhor desempenho open-weight em programação. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Pode funcionar com 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV suportando contexto de 100K.

55,6GB FP16, 16GB de VRAM com IQ4_XS + compressão de cache KV, arquitetura densa, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), transferências GGUF

Experimentar 27B Transferir

Qwen 3.6 35B A3B

Open-weight

Modelo MoE com 35B total / 3B de parâmetros ativos. Desempenho próximo do 27B numa pegada de GPU de consumo. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Funciona no Mac M4 16GB com quantização Q3 (~17GB). 20-40 tok/s em hardware de consumo a 4 bits. Visão e multimodal suportados.

~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B parâmetros ativos, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), transferências GGUF

Experimentar 35B A3B Transferir

Ecossistema Qwen

Uma família de modelos unificada para cada cenário de implementação e orçamento

Desde API na cloud a $0.40/M de tokens até implementação em portátil Mac M4, a família Qwen 3.6 proporciona qualidade consistente, interfaces compatíveis e relação preço-desempenho líder do setor em todos os alvos de implementação.

Explorar todos os modelos Documentação oficial

Qwen 3.6 Plus

78,8% SWE-bench, contexto 1M, $0.40/M de tokens

Experimentar Plus

Qwen 3.6 Max

Raciocínio avançado e multimodal

Experimentar Max

Qwen 3.6 27B

77,2% SWE-bench, supera o Claude no SkillsBench

Experimentar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, amigável para Mac M4 16GB

Experimentar 35B

Referência da API

Endpoints compatíveis com OpenAI, preserve_thinking

Ver API

Comunidade

Junta-te à comunidade de programadores Qwen

Aderir

Começar

Pronto para explorar a família Qwen 3.6? Experimenta gratuitamente, implementa em qualquer lugar

Experimenta qualquer modelo Qwen 3.6 gratuitamente no navegador ou via nível gratuito do OpenRouter. Transfere modelos open-weight sob Apache 2.0 para executar no teu próprio hardware. Do Mac M4 16GB a servidores de produção, de API a $0.40/M de tokens a implementação local sem custos.

Começar a Conversar Comparar modelos