Qwen 3.6 API
API compatível com OpenAI com preserve_thinking - 12x mais barata que o Claude Opus 4.6
Acesse os modelos Qwen 3.6 Plus, Max e open-weight através de uma API compatível com OpenAI. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada e $2.40 por milhão de tokens de saída para o qwen-plus, tornando-o aproximadamente 12x mais barato que o Claude Opus 4.6. Substituição direta para integrações OpenAI existentes com o parâmetro preserve_thinking para manter o estado de raciocínio entre loops de agentes. Janela de contexto de 1M com até 65.536 tokens de saída. Disponível via DashScope direto e OpenRouter com nível gratuito de preview.
Guia da API
Integre o Qwen 3.6 nas suas aplicações com alterações mínimas de código
A API do Qwen 3.6 segue o formato de chat completions da OpenAI, tornando-a uma substituição direta para integrações existentes. A extensão preserve_thinking adiciona capacidades agênticas sem quebrar a compatibilidade. A invocação em lote no DashScope funciona com 50% do preço em tempo real.
Compatibilidade com OpenAI
Endpoint padrão de chat completions com mensagens, ferramentas e suporte a streaming. Mude da OpenAI alterando apenas a URL base e a chave de API - sem alterações de código necessárias. Suporta chamada de funções, modo JSON, saídas estruturadas e entradas de visão/multimodais. Compatível com Claude Code, OpenClaw, Aider, Continue.dev e qualquer ferramenta que suporte o formato de API OpenAI. A janela de contexto de 1M suporta até 65.536 tokens de saída por requisição.
Preços do DashScope
Acesso direto à API através da plataforma DashScope da Alibaba Cloud com preços competitivos. qwen-plus: $0.40 por milhão de tokens de entrada, $2.40 por milhão de tokens de saída - aproximadamente 12x mais barato que o Claude Opus 4.6 para tarefas equivalentes. Invocação em lote disponível com 50% do preço em tempo real para cargas de trabalho não sensíveis à latência como processamento de dados, avaliação e geração em massa. Cadastre-se para uma chave de API em dashscope.aliyuncs.com.
Integração com OpenRouter
Acesse os modelos Qwen 3.6 através da API unificada do OpenRouter junto com mais de 200 outros modelos. Nível gratuito de preview disponível em qwen/qwen3.6-plus:free sem cartão de crédito. O nível pago usa preços de repasse mais uma taxa de 5,5%. Uma única chave de API para acesso multi-provedor com fallback automático e balanceamento de carga. O OpenRouter gerencia limites de taxa e fornece análises de uso em todos os seus provedores de modelo.
Parâmetro preserve_thinking
Extensão de API pioneira que mantém o estado de raciocínio interno do modelo entre iterações de loops de agentes. Defina preserve_thinking: true na sua requisição de API para reduzir re-raciocínio redundante em fluxos de trabalho multi-etapas. Isso melhora a precisão e reduz o uso de tokens em pipelines agênticos em 15-30% em tarefas multi-etapas típicas. Essencial para construir loops de agentes confiáveis com Claude Code, OpenClaw e frameworks agênticos personalizados.
Invocação em lote (50% de desconto)
O DashScope oferece invocação em lote com 50% do preço em tempo real para cargas de trabalho que não exigem respostas imediatas. Envie lotes de requisições e recupere resultados de forma assíncrona. Ideal para processamento de datasets, avaliação de modelos, pipelines de geração de conteúdo e qualquer fluxo de trabalho onde a latência não é crítica. Os jobs em lote suportam o mesmo formato de API das requisições em tempo real.
Janela de contexto de 1M
O Qwen 3.6 Plus suporta uma janela de contexto de 1M de tokens - suficiente para processar bases de código inteiras, artigos de pesquisa longos, documentos jurídicos e conversas multi-turno extensas em uma única passagem. Combinado com até 65.536 tokens de saída, isso permite gerar arquivos completos, análises detalhadas e relatórios abrangentes sem truncamento. A janela de contexto está disponível tanto no DashScope quanto no OpenRouter.
Suporte a SDKs e frameworks
Funciona com qualquer SDK compatível com OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e mais. Integrações com LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponíveis prontas para uso. Nenhum SDK personalizado necessário - basta alterar a URL base. O SDK Python do DashScope também oferece acesso nativo com recursos adicionais como gerenciamento de lotes e rastreamento de uso.
Opção de API auto-hospedada
Para equipes que precisam de controle total dos dados, implante modelos open-weight do Qwen 3.6 (27B, 35B A3B) com vLLM, SGLang ou KTransformers para criar seu próprio endpoint de API compatível com OpenAI. Mesmo formato de API do DashScope e OpenRouter, então o código da sua aplicação funciona sem alterações. Custo por token zero após o investimento em hardware.
Referência da API
Início rápido com a API do Qwen 3.6
Endpoints essenciais, preços, parâmetros e configuração para começar com a API do Qwen 3.6 via DashScope ou OpenRouter.
Endpoints e recursos principais
- POST /v1/chat/completions - Chat completions (streaming suportado)
- POST /v1/embeddings - Embeddings de texto
- GET /v1/models - Listar modelos disponíveis
- preserve_thinking: true - Habilitar persistência do estado de raciocínio
- Janela de contexto de 1M, até 65.536 tokens de saída
- Chamada de funções, modo JSON, saídas estruturadas, visão
Preços (DashScope)
- qwen-plus entrada: $0.40 por milhão de tokens
- qwen-plus saída: $2.40 por milhão de tokens
- Invocação em lote: 50% do preço em tempo real
- ~12x mais barato que o Claude Opus 4.6 para tarefas equivalentes
- Nível gratuito OpenRouter: qwen/qwen3.6-plus:free (sem cartão de crédito)
- OpenRouter pago: preço de repasse + taxa de 5,5%
Modelos disponíveis
- qwen-3.6-plus - Principal, contexto de 1M, preserve_thinking
- qwen-3.6-max - Raciocínio avançado, multimodal
- qwen-3.6-27b - Open-weight denso, melhor desempenho em código
- qwen-3.6-35b-a3b - Open-weight MoE, custo-benefício
- Auto-hospedado via vLLM, SGLang, KTransformers
Comece agora
Comece a construir com a API do Qwen 3.6 em minutos
Obtenha sua chave de API e faça sua primeira requisição. O formato compatível com OpenAI significa que você pode começar com ferramentas e SDKs familiares.
Cadastre-se e obtenha sua chave de API no Alibaba Cloud DashScope
Acesse o Qwen 3.6 pelo OpenRouter - nível gratuito disponível
Use o SDK Python padrão da OpenAI com o Qwen 3.6
Integre o Qwen 3.6 em aplicações Node.js
Envie jobs em lote com 50% de desconto para cargas de trabalho em massa
Estime custos para sua carga de trabalho vs Claude, GPT-4o, Gemini
Uso avançado
Construa fluxos agênticos com preserve_thinking e chamada de ferramentas
Aproveite o parâmetro preserve_thinking, chamada de funções e contexto de 1M para pipelines complexos de agentes multi-etapas e aplicações em produção.
Integração com LangChain, AutoGen, CrewAI e Semantic Kernel
Chamada de funções, protocolo MCP e uso estruturado de ferramentas
Server-sent events para respostas em tempo real e progresso
Use o Qwen 3.6 como backend para o Claude Code via API
Implante com vLLM ou SGLang para custo por token zero
Ecossistema Qwen
Um formato de API, múltiplos pontos de acesso, preços líderes do setor
Acesse o Qwen 3.6 pelo DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nível gratuito disponível) ou vLLM auto-hospedado - todos usando o mesmo formato de API compatível com OpenAI com suporte a preserve_thinking.
Comece agora
Pronto para integrar o Qwen 3.6? Comece com o nível gratuito, escale com preços de $0.40/M de tokens
Comece a conversar gratuitamente e depois integre via API compatível com OpenAI. Substituição direta com preserve_thinking para fluxos agênticos. DashScope a $0.40/$2.40 por milhão de tokens ou nível gratuito do OpenRouter - sem cartão de crédito.