Modelos Qwen 3.6

Quatro modelos, uma família - do Mac M4 16GB ao desempenho de fronteira a $0.40/M de tokens

A família Qwen 3.6 abrange modelos proprietários hospedados e lançamentos open-weight. O Plus entrega 78,8% SWE-bench com contexto de 1M e preserve_thinking a $0.40/$2.40 por milhão de tokens (12x mais barato que o Claude Opus 4.6). O Max lida com raciocínio avançado e tarefas multimodais. O modelo denso 27B alcança 77,2% SWE-bench e 48,2 SkillsBench (superando o Claude 4.5 Opus). O 35B A3B MoE roda no Mac M4 16GB com quantização Q3 a 20-40 tok/s. Todos os modelos compartilham a mesma base de arquitetura e API compatível com OpenAI.

Começar a Conversar Comparar modelos

Família de modelos

Escolha o modelo Qwen 3.6 certo para seu caso de uso e orçamento

De implantação local leve em um laptop a desempenho máximo hospedado com contexto de 1M, a família Qwen 3.6 cobre cada escala, orçamento e cenário de implantação.

Proprietário

Modelos hospedados com desempenho máximo e contexto de 1M

Plus e Max são modelos proprietários disponíveis via API. Oferecem o maior desempenho, janelas de contexto de 1M, até 65.536 tokens de saída e recursos como preserve_thinking exclusivos do nível hospedado. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada - aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote disponível com 50% do preço em tempo real.

Disponível via API compatível com OpenAI pelo DashScope e OpenRouter (nível gratuito disponível)

Ver preços da API

Open-weight

Execute no seu próprio hardware com controle total - licenciado sob Apache 2.0

Os modelos denso 27B e 35B A3B MoE são lançados sob a licença Apache 2.0. Implante localmente com Ollama, vLLM, llama.cpp, SGLang ou KTransformers. O 27B cabe em 16GB de VRAM com IQ4_XS GGUF e compressão de cache KV. O 35B A3B roda no Mac M4 16GB com quantização Q3. Custo por token zero, privacidade total dos dados e liberdade para ajuste fino.

Disponível no HuggingFace, Ollama e repositórios GGUF

Qwen 3.6 Plus

Proprietário

Modelo proprietário principal com contexto de 1M, preserve_thinking para fluxos agênticos e desempenho de ponta. 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0, 56,6 SWE-bench Pro. Preços DashScope: $0.40 entrada / $2.40 saída por milhão de tokens, aproximadamente 12x mais barato que o Claude Opus 4.6. Invocação em lote com 50% de desconto. Até 65.536 tokens de saída por requisição.

Janela de contexto de 1M, parâmetro preserve_thinking, 65K tokens de saída, lote com 50% de desconto

Acesso via API pelo DashScope e OpenRouter (nível gratuito de preview disponível)

Experimentar Plus Docs da API

Qwen 3.6 Max

Proprietário

Modelo proprietário de alto desempenho otimizado para raciocínio complexo, tarefas multimodais e compreensão de documentos. Forte em matemática, ciência, análise visual e processamento de documentos longos. Janela de contexto estendida com capacidades avançadas de raciocínio para as tarefas analíticas mais exigentes.

Contexto estendido, capacidades multimodais, raciocínio avançado, compreensão de documentos

Acesso via API pelo DashScope e OpenRouter

Experimentar Max Docs da API

Qwen 3.6 27B

Open-weight

Modelo denso de 27B de parâmetros entregando o melhor desempenho open-weight em programação. 77,2% SWE-bench Verified, 59,3 Terminal-Bench 2.0, 83,9 LiveCodeBench, 48,2 SkillsBench (supera o Claude 4.5 Opus com 45,3), 1487 QwenWebBench, 36,2 NL2Repo, 72,4 Claw-Eval. Pode rodar em 16GB de VRAM usando IQ4_XS GGUF com compressão de cache KV suportando contexto de 100K.

55,6GB FP16, 16GB de VRAM com IQ4_XS + compressão de cache KV, arquitetura densa, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), downloads GGUF

Experimentar 27B Baixar

Qwen 3.6 35B A3B

Open-weight

Modelo MoE com 35B total / 3B de parâmetros ativos. Desempenho próximo ao 27B em um footprint de GPU de consumo. 73,4% SWE-bench Verified, 51,5 Terminal-Bench 2.0, 80,4 LiveCodeBench, 68,7 Claw-Eval, 1397 QwenWebBench. Roda no Mac M4 16GB com quantização Q3 (~17GB). 20-40 tok/s em hardware de consumo com 4-bit. Visão e multimodal suportados.

~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B de parâmetros ativos, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), downloads GGUF

Experimentar 35B A3B Baixar

Ecossistema Qwen

Uma família de modelos unificada para cada cenário de implantação e orçamento

Da API na nuvem a $0.40/M de tokens à implantação em laptop Mac M4, a família Qwen 3.6 oferece qualidade consistente, interfaces compatíveis e custo-benefício líder do setor em todos os alvos de implantação.

Explorar todos os modelos Documentação oficial

Qwen 3.6 Plus

78,8% SWE-bench, contexto de 1M, $0.40/M de tokens

Experimentar Plus

Qwen 3.6 Max

Raciocínio avançado e multimodal

Experimentar Max

Qwen 3.6 27B

77,2% SWE-bench, supera o Claude no SkillsBench

Experimentar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, amigável para Mac M4 16GB

Experimentar 35B

Referência da API

Endpoints compatíveis com OpenAI, preserve_thinking

Ver API

Comunidade

Participe da comunidade de desenvolvedores Qwen

Participar

Comece agora

Pronto para explorar a família Qwen 3.6? Experimente grátis, implante em qualquer lugar

Experimente qualquer modelo Qwen 3.6 gratuitamente no navegador ou pelo nível gratuito do OpenRouter. Baixe modelos open-weight sob Apache 2.0 para executar no seu próprio hardware. Do Mac M4 16GB a servidores de produção, da API a $0.40/M de tokens à implantação local sem custo.

Começar a Conversar Comparar modelos