Qwen 3.6 API

API compatível com OpenAI com preserve_thinking - 12x mais barata que o Claude Opus 4.6

Acede ao Qwen 3.6 Plus, Max e modelos open-weight através de uma API compatível com OpenAI. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada e $2.40 por milhão de tokens de saída para o qwen-plus, tornando-o aproximadamente 12x mais barato que o Claude Opus 4.6. Substituição direta para integrações OpenAI existentes com o parâmetro preserve_thinking para manter o estado de raciocínio entre iterações de agentes. Janela de contexto de 1M com até 65.536 tokens de saída. Disponível via DashScope direto e OpenRouter com nível gratuito de pré-visualização.

Guia da API

Integra o Qwen 3.6 nas tuas aplicações com alterações mínimas de código

A API do Qwen 3.6 segue o formato de conclusões de chat da OpenAI, tornando-a uma substituição direta para integrações existentes. A extensão preserve_thinking adiciona capacidades agênticas sem quebrar a compatibilidade. A invocação em lote no DashScope funciona a 50% do preço em tempo real.

Compatibilidade com OpenAI

Endpoint padrão de conclusões de chat com mensagens, ferramentas e suporte a streaming. Muda da OpenAI alterando apenas o URL base e a chave API - sem alterações de código necessárias. Suporta chamada de funções, modo JSON, saídas estruturadas e entradas de visão/multimodais. Compatível com Claude Code, OpenClaw, Aider, Continue.dev e qualquer ferramenta que suporte o formato de API OpenAI. A janela de contexto de 1M suporta até 65.536 tokens de saída por pedido.

Preços do DashScope

Acesso direto à API através da plataforma DashScope da Alibaba Cloud com preços competitivos. qwen-plus: $0.40 por milhão de tokens de entrada, $2.40 por milhão de tokens de saída - aproximadamente 12x mais barato que o Claude Opus 4.6 para tarefas equivalentes. Invocação em lote disponível a 50% do preço em tempo real para cargas de trabalho não sensíveis à latência como processamento de dados, avaliação e geração em massa. Regista-te para uma chave API em dashscope.aliyuncs.com.

Integração com OpenRouter

Acede aos modelos Qwen 3.6 através da API unificada do OpenRouter juntamente com mais de 200 outros modelos. Nível gratuito de pré-visualização disponível em qwen/qwen3.6-plus:free sem necessidade de cartão de crédito. O nível pago utiliza preços de passagem mais uma taxa de 5,5%. Uma única chave API para acesso multi-fornecedor com fallback automático e balanceamento de carga. O OpenRouter gere os limites de utilização e fornece análises de uso em todos os teus fornecedores de modelos.

Parâmetro preserve_thinking

Extensão de API pioneira que mantém o estado de raciocínio interno do modelo entre iterações de ciclos de agentes. Define preserve_thinking: true no teu pedido API para reduzir o re-raciocínio redundante em fluxos de trabalho multi-passo. Isto melhora a precisão e reduz o uso de tokens em pipelines agênticos em 15-30% em tarefas multi-passo típicas. Essencial para construir ciclos de agentes fiáveis com Claude Code, OpenClaw e frameworks agênticos personalizados.

Invocação em lote (50% de desconto)

O DashScope oferece invocação em lote a 50% do preço em tempo real para cargas de trabalho que não requerem respostas imediatas. Submete lotes de pedidos e recupera resultados de forma assíncrona. Ideal para processamento de conjuntos de dados, avaliação de modelos, pipelines de geração de conteúdo e qualquer fluxo de trabalho onde a latência não é crítica. Os trabalhos em lote suportam o mesmo formato de API que os pedidos em tempo real.

Janela de contexto de 1M

O Qwen 3.6 Plus suporta uma janela de contexto de 1M de tokens - suficiente para processar bases de código inteiras, artigos de investigação longos, documentos legais e conversas multi-turno extensas numa única passagem. Combinado com até 65.536 tokens de saída, isto permite gerar ficheiros completos, análises detalhadas e relatórios abrangentes sem truncagem. A janela de contexto está disponível tanto no DashScope como no OpenRouter.

Suporte a SDK e frameworks

Funciona com qualquer SDK compatível com OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e mais. Integrações com LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponíveis de imediato. Sem necessidade de SDK personalizado - basta alterar o URL base. O SDK Python do DashScope também fornece acesso nativo com funcionalidades adicionais como gestão de lotes e rastreamento de utilização.

Opção de API auto-alojada

Para equipas que necessitam de controlo total dos dados, implementa os modelos open-weight do Qwen 3.6 (27B, 35B A3B) com vLLM, SGLang ou KTransformers para criar o teu próprio endpoint de API compatível com OpenAI. Mesmo formato de API que o DashScope e o OpenRouter, pelo que o código da tua aplicação funciona sem alterações. Sem custos por token após o investimento em hardware.

Referência da API

Início rápido com a API do Qwen 3.6

Endpoints essenciais, preços, parâmetros e configuração para começar com a API do Qwen 3.6 via DashScope ou OpenRouter.

Endpoints e funcionalidades principais

  • POST /v1/chat/completions - Conclusões de chat (streaming suportado)
  • POST /v1/embeddings - Embeddings de texto
  • GET /v1/models - Listar modelos disponíveis
  • preserve_thinking: true - Ativar persistência do estado de raciocínio
  • Janela de contexto de 1M, até 65.536 tokens de saída
  • Chamada de funções, modo JSON, saídas estruturadas, visão

Preços (DashScope)

  • qwen-plus entrada: $0.40 por milhão de tokens
  • qwen-plus saída: $2.40 por milhão de tokens
  • Invocação em lote: 50% do preço em tempo real
  • ~12x mais barato que o Claude Opus 4.6 para tarefas equivalentes
  • Nível gratuito OpenRouter: qwen/qwen3.6-plus:free (sem cartão de crédito)
  • OpenRouter pago: preço de passagem + taxa de 5,5%

Modelos disponíveis

  • qwen-3.6-plus - Principal, contexto 1M, preserve_thinking
  • qwen-3.6-max - Raciocínio avançado, multimodal
  • qwen-3.6-27b - Denso open-weight, melhor desempenho em programação
  • qwen-3.6-35b-a3b - MoE open-weight, custo-eficiente
  • Auto-alojado via vLLM, SGLang, KTransformers

Ecossistema Qwen

Um formato de API, múltiplos pontos de acesso, preços líderes do setor

Acede ao Qwen 3.6 através do DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nível gratuito disponível) ou vLLM auto-alojado - todos usando o mesmo formato de API compatível com OpenAI com suporte a preserve_thinking.

DashScope

API direta, $0.40/$2.40 por M de tokens

Registar

OpenRouter

API unificada com nível gratuito disponível

Começar

vLLM auto-alojado

Executa o teu próprio endpoint API, sem custos por token

Implementar

Python SDK

Biblioteca Python OpenAI padrão, substituição direta

Instalar

Referência da API

Documentação completa de endpoints e parâmetros

Ler documentação

Preços

Preços baseados em utilização, lote com 50% de desconto

Ver preços

Começar

Pronto para integrar o Qwen 3.6? Começa com o nível gratuito, escala com preços de $0.40/M de tokens

Começa a conversar gratuitamente e depois integra via API compatível com OpenAI. Substituição direta com preserve_thinking para fluxos de trabalho agênticos. DashScope a $0.40/$2.40 por milhão de tokens ou nível gratuito OpenRouter - sem cartão de crédito necessário.