Qwen 3.6 API

API compatível com OpenAI com preserve_thinking - 12x mais barata que o Claude Opus 4.6

Acesse os modelos Qwen 3.6 Plus, Max e open-weight através de uma API compatível com OpenAI. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada e $2.40 por milhão de tokens de saída para o qwen-plus, tornando-o aproximadamente 12x mais barato que o Claude Opus 4.6. Substituição direta para integrações OpenAI existentes com o parâmetro preserve_thinking para manter o estado de raciocínio entre loops de agentes. Janela de contexto de 1M com até 65.536 tokens de saída. Disponível via DashScope direto e OpenRouter com nível gratuito de preview.

Guia da API

Integre o Qwen 3.6 nas suas aplicações com alterações mínimas de código

A API do Qwen 3.6 segue o formato de chat completions da OpenAI, tornando-a uma substituição direta para integrações existentes. A extensão preserve_thinking adiciona capacidades agênticas sem quebrar a compatibilidade. A invocação em lote no DashScope funciona com 50% do preço em tempo real.

Compatibilidade com OpenAI

Endpoint padrão de chat completions com mensagens, ferramentas e suporte a streaming. Mude da OpenAI alterando apenas a URL base e a chave de API - sem alterações de código necessárias. Suporta chamada de funções, modo JSON, saídas estruturadas e entradas de visão/multimodais. Compatível com Claude Code, OpenClaw, Aider, Continue.dev e qualquer ferramenta que suporte o formato de API OpenAI. A janela de contexto de 1M suporta até 65.536 tokens de saída por requisição.

Preços do DashScope

Acesso direto à API através da plataforma DashScope da Alibaba Cloud com preços competitivos. qwen-plus: $0.40 por milhão de tokens de entrada, $2.40 por milhão de tokens de saída - aproximadamente 12x mais barato que o Claude Opus 4.6 para tarefas equivalentes. Invocação em lote disponível com 50% do preço em tempo real para cargas de trabalho não sensíveis à latência como processamento de dados, avaliação e geração em massa. Cadastre-se para uma chave de API em dashscope.aliyuncs.com.

Integração com OpenRouter

Acesse os modelos Qwen 3.6 através da API unificada do OpenRouter junto com mais de 200 outros modelos. Nível gratuito de preview disponível em qwen/qwen3.6-plus:free sem cartão de crédito. O nível pago usa preços de repasse mais uma taxa de 5,5%. Uma única chave de API para acesso multi-provedor com fallback automático e balanceamento de carga. O OpenRouter gerencia limites de taxa e fornece análises de uso em todos os seus provedores de modelo.

Parâmetro preserve_thinking

Extensão de API pioneira que mantém o estado de raciocínio interno do modelo entre iterações de loops de agentes. Defina preserve_thinking: true na sua requisição de API para reduzir re-raciocínio redundante em fluxos de trabalho multi-etapas. Isso melhora a precisão e reduz o uso de tokens em pipelines agênticos em 15-30% em tarefas multi-etapas típicas. Essencial para construir loops de agentes confiáveis com Claude Code, OpenClaw e frameworks agênticos personalizados.

Invocação em lote (50% de desconto)

O DashScope oferece invocação em lote com 50% do preço em tempo real para cargas de trabalho que não exigem respostas imediatas. Envie lotes de requisições e recupere resultados de forma assíncrona. Ideal para processamento de datasets, avaliação de modelos, pipelines de geração de conteúdo e qualquer fluxo de trabalho onde a latência não é crítica. Os jobs em lote suportam o mesmo formato de API das requisições em tempo real.

Janela de contexto de 1M

O Qwen 3.6 Plus suporta uma janela de contexto de 1M de tokens - suficiente para processar bases de código inteiras, artigos de pesquisa longos, documentos jurídicos e conversas multi-turno extensas em uma única passagem. Combinado com até 65.536 tokens de saída, isso permite gerar arquivos completos, análises detalhadas e relatórios abrangentes sem truncamento. A janela de contexto está disponível tanto no DashScope quanto no OpenRouter.

Suporte a SDKs e frameworks

Funciona com qualquer SDK compatível com OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e mais. Integrações com LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponíveis prontas para uso. Nenhum SDK personalizado necessário - basta alterar a URL base. O SDK Python do DashScope também oferece acesso nativo com recursos adicionais como gerenciamento de lotes e rastreamento de uso.

Opção de API auto-hospedada

Para equipes que precisam de controle total dos dados, implante modelos open-weight do Qwen 3.6 (27B, 35B A3B) com vLLM, SGLang ou KTransformers para criar seu próprio endpoint de API compatível com OpenAI. Mesmo formato de API do DashScope e OpenRouter, então o código da sua aplicação funciona sem alterações. Custo por token zero após o investimento em hardware.

Referência da API

Início rápido com a API do Qwen 3.6

Endpoints essenciais, preços, parâmetros e configuração para começar com a API do Qwen 3.6 via DashScope ou OpenRouter.

Endpoints e recursos principais

  • POST /v1/chat/completions - Chat completions (streaming suportado)
  • POST /v1/embeddings - Embeddings de texto
  • GET /v1/models - Listar modelos disponíveis
  • preserve_thinking: true - Habilitar persistência do estado de raciocínio
  • Janela de contexto de 1M, até 65.536 tokens de saída
  • Chamada de funções, modo JSON, saídas estruturadas, visão

Preços (DashScope)

  • qwen-plus entrada: $0.40 por milhão de tokens
  • qwen-plus saída: $2.40 por milhão de tokens
  • Invocação em lote: 50% do preço em tempo real
  • ~12x mais barato que o Claude Opus 4.6 para tarefas equivalentes
  • Nível gratuito OpenRouter: qwen/qwen3.6-plus:free (sem cartão de crédito)
  • OpenRouter pago: preço de repasse + taxa de 5,5%

Modelos disponíveis

  • qwen-3.6-plus - Principal, contexto de 1M, preserve_thinking
  • qwen-3.6-max - Raciocínio avançado, multimodal
  • qwen-3.6-27b - Open-weight denso, melhor desempenho em código
  • qwen-3.6-35b-a3b - Open-weight MoE, custo-benefício
  • Auto-hospedado via vLLM, SGLang, KTransformers

Ecossistema Qwen

Um formato de API, múltiplos pontos de acesso, preços líderes do setor

Acesse o Qwen 3.6 pelo DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nível gratuito disponível) ou vLLM auto-hospedado - todos usando o mesmo formato de API compatível com OpenAI com suporte a preserve_thinking.

DashScope

API direta, $0.40/$2.40 por M de tokens

Cadastrar

OpenRouter

API unificada com nível gratuito disponível

Começar

vLLM auto-hospedado

Execute seu próprio endpoint de API, custo por token zero

Implantar

SDK Python

Biblioteca Python padrão da OpenAI, substituição direta

Instalar

Referência da API

Documentação completa de endpoints e parâmetros

Ler docs

Preços

Preços por uso, lote com 50% de desconto

Ver preços

Comece agora

Pronto para integrar o Qwen 3.6? Comece com o nível gratuito, escale com preços de $0.40/M de tokens

Comece a conversar gratuitamente e depois integre via API compatível com OpenAI. Substituição direta com preserve_thinking para fluxos agênticos. DashScope a $0.40/$2.40 por milhão de tokens ou nível gratuito do OpenRouter - sem cartão de crédito.