Qwen 3.6 API

API compatível com OpenAI com preserve_thinking - 12x mais barata que o Claude Opus 4.6

Acesse os modelos Qwen 3.6 Plus, Max e open-weight através de uma API compatível com OpenAI. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada e $2.40 por milhão de tokens de saída para o qwen-plus, tornando-o aproximadamente 12x mais barato que o Claude Opus 4.6. Substituição direta para integrações OpenAI existentes com o parâmetro preserve_thinking para manter o estado de raciocínio entre loops de agentes. Janela de contexto de 1M com até 65.536 tokens de saída. Disponível via DashScope direto e OpenRouter com nível gratuito de preview.

Começar a Conversar Ver documentação da API

Guia da API

Integre o Qwen 3.6 nas suas aplicações com alterações mínimas de código

A API do Qwen 3.6 segue o formato de chat completions da OpenAI, tornando-a uma substituição direta para integrações existentes. A extensão preserve_thinking adiciona capacidades agênticas sem quebrar a compatibilidade. A invocação em lote no DashScope funciona com 50% do preço em tempo real.

Compatibilidade com OpenAI

Endpoint padrão de chat completions com mensagens, ferramentas e suporte a streaming. Mude da OpenAI alterando apenas a URL base e a chave de API - sem alterações de código necessárias. Suporta chamada de funções, modo JSON, saídas estruturadas e entradas de visão/multimodais. Compatível com Claude Code, OpenClaw, Aider, Continue.dev e qualquer ferramenta que suporte o formato de API OpenAI. A janela de contexto de 1M suporta até 65.536 tokens de saída por requisição.

Preços do DashScope

Acesso direto à API através da plataforma DashScope da Alibaba Cloud com preços competitivos. qwen-plus: $0.40 por milhão de tokens de entrada, $2.40 por milhão de tokens de saída - aproximadamente 12x mais barato que o Claude Opus 4.6 para tarefas equivalentes. Invocação em lote disponível com 50% do preço em tempo real para cargas de trabalho não sensíveis à latência como processamento de dados, avaliação e geração em massa. Cadastre-se para uma chave de API em dashscope.aliyuncs.com.

Integração com OpenRouter

Acesse os modelos Qwen 3.6 através da API unificada do OpenRouter junto com mais de 200 outros modelos. Nível gratuito de preview disponível em qwen/qwen3.6-plus:free sem cartão de crédito. O nível pago usa preços de repasse mais uma taxa de 5,5%. Uma única chave de API para acesso multi-provedor com fallback automático e balanceamento de carga. O OpenRouter gerencia limites de taxa e fornece análises de uso em todos os seus provedores de modelo.

Parâmetro preserve_thinking

Extensão de API pioneira que mantém o estado de raciocínio interno do modelo entre iterações de loops de agentes. Defina preserve_thinking: true na sua requisição de API para reduzir re-raciocínio redundante em fluxos de trabalho multi-etapas. Isso melhora a precisão e reduz o uso de tokens em pipelines agênticos em 15-30% em tarefas multi-etapas típicas. Essencial para construir loops de agentes confiáveis com Claude Code, OpenClaw e frameworks agênticos personalizados.

Invocação em lote (50% de desconto)

O DashScope oferece invocação em lote com 50% do preço em tempo real para cargas de trabalho que não exigem respostas imediatas. Envie lotes de requisições e recupere resultados de forma assíncrona. Ideal para processamento de datasets, avaliação de modelos, pipelines de geração de conteúdo e qualquer fluxo de trabalho onde a latência não é crítica. Os jobs em lote suportam o mesmo formato de API das requisições em tempo real.

Janela de contexto de 1M

O Qwen 3.6 Plus suporta uma janela de contexto de 1M de tokens - suficiente para processar bases de código inteiras, artigos de pesquisa longos, documentos jurídicos e conversas multi-turno extensas em uma única passagem. Combinado com até 65.536 tokens de saída, isso permite gerar arquivos completos, análises detalhadas e relatórios abrangentes sem truncamento. A janela de contexto está disponível tanto no DashScope quanto no OpenRouter.

Suporte a SDKs e frameworks

Funciona com qualquer SDK compatível com OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e mais. Integrações com LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponíveis prontas para uso. Nenhum SDK personalizado necessário - basta alterar a URL base. O SDK Python do DashScope também oferece acesso nativo com recursos adicionais como gerenciamento de lotes e rastreamento de uso.

Opção de API auto-hospedada

Para equipes que precisam de controle total dos dados, implante modelos open-weight do Qwen 3.6 (27B, 35B A3B) com vLLM, SGLang ou KTransformers para criar seu próprio endpoint de API compatível com OpenAI. Mesmo formato de API do DashScope e OpenRouter, então o código da sua aplicação funciona sem alterações. Custo por token zero após o investimento em hardware.

Referência da API

Início rápido com a API do Qwen 3.6

Endpoints essenciais, preços, parâmetros e configuração para começar com a API do Qwen 3.6 via DashScope ou OpenRouter.

Endpoints e recursos principais

POST /v1/chat/completions - Chat completions (streaming suportado)
POST /v1/embeddings - Embeddings de texto
GET /v1/models - Listar modelos disponíveis
preserve_thinking: true - Habilitar persistência do estado de raciocínio
Janela de contexto de 1M, até 65.536 tokens de saída
Chamada de funções, modo JSON, saídas estruturadas, visão

Preços (DashScope)

qwen-plus entrada: $0.40 por milhão de tokens
qwen-plus saída: $2.40 por milhão de tokens
Invocação em lote: 50% do preço em tempo real
~12x mais barato que o Claude Opus 4.6 para tarefas equivalentes
Nível gratuito OpenRouter: qwen/qwen3.6-plus:free (sem cartão de crédito)
OpenRouter pago: preço de repasse + taxa de 5,5%

Modelos disponíveis

qwen-3.6-plus - Principal, contexto de 1M, preserve_thinking
qwen-3.6-max - Raciocínio avançado, multimodal
qwen-3.6-27b - Open-weight denso, melhor desempenho em código
qwen-3.6-35b-a3b - Open-weight MoE, custo-benefício
Auto-hospedado via vLLM, SGLang, KTransformers

Começar a Conversar Documentação da API

Comece agora

Comece a construir com a API do Qwen 3.6 em minutos

Obtenha sua chave de API e faça sua primeira requisição. O formato compatível com OpenAI significa que você pode começar com ferramentas e SDKs familiares.

Início rápido DashScope

Cadastre-se e obtenha sua chave de API no Alibaba Cloud DashScope

Configuração OpenRouter

Acesse o Qwen 3.6 pelo OpenRouter - nível gratuito disponível

Guia do SDK Python

Use o SDK Python padrão da OpenAI com o Qwen 3.6

Guia do SDK Node.js

Integre o Qwen 3.6 em aplicações Node.js

Guia de invocação em lote

Envie jobs em lote com 50% de desconto para cargas de trabalho em massa

tag

Calculadora de preços

Estime custos para sua carga de trabalho vs Claude, GPT-4o, Gemini

Uso avançado

Construa fluxos agênticos com preserve_thinking e chamada de ferramentas

Aproveite o parâmetro preserve_thinking, chamada de funções e contexto de 1M para pipelines complexos de agentes multi-etapas e aplicações em produção.

Frameworks de agentes

Integração com LangChain, AutoGen, CrewAI e Semantic Kernel

Guia de chamada de ferramentas

Chamada de funções, protocolo MCP e uso estruturado de ferramentas

Guia de streaming

Server-sent events para respostas em tempo real e progresso

Integração com Claude Code

Use o Qwen 3.6 como backend para o Claude Code via API

Implantação auto-hospedada

Implante com vLLM ou SGLang para custo por token zero

Ecossistema Qwen

Um formato de API, múltiplos pontos de acesso, preços líderes do setor

Acesse o Qwen 3.6 pelo DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nível gratuito disponível) ou vLLM auto-hospedado - todos usando o mesmo formato de API compatível com OpenAI com suporte a preserve_thinking.

Explorar todos os modelos Documentação da API

DashScope

API direta, $0.40/$2.40 por M de tokens

Cadastrar

OpenRouter

API unificada com nível gratuito disponível

Começar

vLLM auto-hospedado

Execute seu próprio endpoint de API, custo por token zero

Implantar

SDK Python

Biblioteca Python padrão da OpenAI, substituição direta

Instalar

Referência da API

Documentação completa de endpoints e parâmetros

Ler docs

Preços

Preços por uso, lote com 50% de desconto

Ver preços

Comece agora

Pronto para integrar o Qwen 3.6? Comece com o nível gratuito, escale com preços de $0.40/M de tokens

Comece a conversar gratuitamente e depois integre via API compatível com OpenAI. Substituição direta com preserve_thinking para fluxos agênticos. DashScope a $0.40/$2.40 por milhão de tokens ou nível gratuito do OpenRouter - sem cartão de crédito.

Começar a Conversar Documentação da API