Qwen 3.6 API

API compatível com OpenAI com preserve_thinking - 12x mais barata que o Claude Opus 4.6

Acede ao Qwen 3.6 Plus, Max e modelos open-weight através de uma API compatível com OpenAI. Os preços do DashScope começam em $0.40 por milhão de tokens de entrada e $2.40 por milhão de tokens de saída para o qwen-plus, tornando-o aproximadamente 12x mais barato que o Claude Opus 4.6. Substituição direta para integrações OpenAI existentes com o parâmetro preserve_thinking para manter o estado de raciocínio entre iterações de agentes. Janela de contexto de 1M com até 65.536 tokens de saída. Disponível via DashScope direto e OpenRouter com nível gratuito de pré-visualização.

Começar a Conversar Ver documentação API

Guia da API

Integra o Qwen 3.6 nas tuas aplicações com alterações mínimas de código

A API do Qwen 3.6 segue o formato de conclusões de chat da OpenAI, tornando-a uma substituição direta para integrações existentes. A extensão preserve_thinking adiciona capacidades agênticas sem quebrar a compatibilidade. A invocação em lote no DashScope funciona a 50% do preço em tempo real.

Compatibilidade com OpenAI

Endpoint padrão de conclusões de chat com mensagens, ferramentas e suporte a streaming. Muda da OpenAI alterando apenas o URL base e a chave API - sem alterações de código necessárias. Suporta chamada de funções, modo JSON, saídas estruturadas e entradas de visão/multimodais. Compatível com Claude Code, OpenClaw, Aider, Continue.dev e qualquer ferramenta que suporte o formato de API OpenAI. A janela de contexto de 1M suporta até 65.536 tokens de saída por pedido.

Preços do DashScope

Acesso direto à API através da plataforma DashScope da Alibaba Cloud com preços competitivos. qwen-plus: $0.40 por milhão de tokens de entrada, $2.40 por milhão de tokens de saída - aproximadamente 12x mais barato que o Claude Opus 4.6 para tarefas equivalentes. Invocação em lote disponível a 50% do preço em tempo real para cargas de trabalho não sensíveis à latência como processamento de dados, avaliação e geração em massa. Regista-te para uma chave API em dashscope.aliyuncs.com.

Integração com OpenRouter

Acede aos modelos Qwen 3.6 através da API unificada do OpenRouter juntamente com mais de 200 outros modelos. Nível gratuito de pré-visualização disponível em qwen/qwen3.6-plus:free sem necessidade de cartão de crédito. O nível pago utiliza preços de passagem mais uma taxa de 5,5%. Uma única chave API para acesso multi-fornecedor com fallback automático e balanceamento de carga. O OpenRouter gere os limites de utilização e fornece análises de uso em todos os teus fornecedores de modelos.

Parâmetro preserve_thinking

Extensão de API pioneira que mantém o estado de raciocínio interno do modelo entre iterações de ciclos de agentes. Define preserve_thinking: true no teu pedido API para reduzir o re-raciocínio redundante em fluxos de trabalho multi-passo. Isto melhora a precisão e reduz o uso de tokens em pipelines agênticos em 15-30% em tarefas multi-passo típicas. Essencial para construir ciclos de agentes fiáveis com Claude Code, OpenClaw e frameworks agênticos personalizados.

Invocação em lote (50% de desconto)

O DashScope oferece invocação em lote a 50% do preço em tempo real para cargas de trabalho que não requerem respostas imediatas. Submete lotes de pedidos e recupera resultados de forma assíncrona. Ideal para processamento de conjuntos de dados, avaliação de modelos, pipelines de geração de conteúdo e qualquer fluxo de trabalho onde a latência não é crítica. Os trabalhos em lote suportam o mesmo formato de API que os pedidos em tempo real.

Janela de contexto de 1M

O Qwen 3.6 Plus suporta uma janela de contexto de 1M de tokens - suficiente para processar bases de código inteiras, artigos de investigação longos, documentos legais e conversas multi-turno extensas numa única passagem. Combinado com até 65.536 tokens de saída, isto permite gerar ficheiros completos, análises detalhadas e relatórios abrangentes sem truncagem. A janela de contexto está disponível tanto no DashScope como no OpenRouter.

Suporte a SDK e frameworks

Funciona com qualquer SDK compatível com OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e mais. Integrações com LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponíveis de imediato. Sem necessidade de SDK personalizado - basta alterar o URL base. O SDK Python do DashScope também fornece acesso nativo com funcionalidades adicionais como gestão de lotes e rastreamento de utilização.

Opção de API auto-alojada

Para equipas que necessitam de controlo total dos dados, implementa os modelos open-weight do Qwen 3.6 (27B, 35B A3B) com vLLM, SGLang ou KTransformers para criar o teu próprio endpoint de API compatível com OpenAI. Mesmo formato de API que o DashScope e o OpenRouter, pelo que o código da tua aplicação funciona sem alterações. Sem custos por token após o investimento em hardware.

Referência da API

Início rápido com a API do Qwen 3.6

Endpoints essenciais, preços, parâmetros e configuração para começar com a API do Qwen 3.6 via DashScope ou OpenRouter.

Endpoints e funcionalidades principais

POST /v1/chat/completions - Conclusões de chat (streaming suportado)
POST /v1/embeddings - Embeddings de texto
GET /v1/models - Listar modelos disponíveis
preserve_thinking: true - Ativar persistência do estado de raciocínio
Janela de contexto de 1M, até 65.536 tokens de saída
Chamada de funções, modo JSON, saídas estruturadas, visão

Preços (DashScope)

qwen-plus entrada: $0.40 por milhão de tokens
qwen-plus saída: $2.40 por milhão de tokens
Invocação em lote: 50% do preço em tempo real
~12x mais barato que o Claude Opus 4.6 para tarefas equivalentes
Nível gratuito OpenRouter: qwen/qwen3.6-plus:free (sem cartão de crédito)
OpenRouter pago: preço de passagem + taxa de 5,5%

Modelos disponíveis

qwen-3.6-plus - Principal, contexto 1M, preserve_thinking
qwen-3.6-max - Raciocínio avançado, multimodal
qwen-3.6-27b - Denso open-weight, melhor desempenho em programação
qwen-3.6-35b-a3b - MoE open-weight, custo-eficiente
Auto-alojado via vLLM, SGLang, KTransformers

Começar a Conversar Documentação da API

Começar

Começa a construir com a API do Qwen 3.6 em minutos

Obtém a tua chave API e faz o teu primeiro pedido. O formato compatível com OpenAI significa que podes começar com ferramentas e SDKs familiares.

Início rápido DashScope

Regista-te e obtém a tua chave API no Alibaba Cloud DashScope

Configuração OpenRouter

Acede ao Qwen 3.6 através do OpenRouter - nível gratuito disponível

Guia Python SDK

Utiliza o SDK Python padrão da OpenAI com o Qwen 3.6

Guia Node.js SDK

Integra o Qwen 3.6 em aplicações Node.js

Guia de invocação em lote

Submete trabalhos em lote a 50% do preço para cargas de trabalho em massa

tag

Calculadora de preços

Estima custos para a tua carga de trabalho vs Claude, GPT-4o, Gemini

Utilização avançada

Constrói fluxos de trabalho agênticos com preserve_thinking e chamada de ferramentas

Aproveita o parâmetro preserve_thinking, chamada de funções e contexto de 1M para pipelines de agentes multi-passo complexos e aplicações de produção.

Frameworks de agentes

Integração com LangChain, AutoGen, CrewAI e Semantic Kernel

Guia de chamada de ferramentas

Chamada de funções, protocolo MCP e uso estruturado de ferramentas

Guia de streaming

Eventos enviados pelo servidor para respostas em tempo real e progresso

Integração Claude Code

Usa o Qwen 3.6 como backend para o Claude Code via API

Implementação auto-alojada

Implementa com vLLM ou SGLang sem custos por token

Ecossistema Qwen

Um formato de API, múltiplos pontos de acesso, preços líderes do setor

Acede ao Qwen 3.6 através do DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nível gratuito disponível) ou vLLM auto-alojado - todos usando o mesmo formato de API compatível com OpenAI com suporte a preserve_thinking.

Explorar todos os modelos Documentação da API

DashScope

API direta, $0.40/$2.40 por M de tokens

Registar

OpenRouter

API unificada com nível gratuito disponível

Começar

vLLM auto-alojado

Executa o teu próprio endpoint API, sem custos por token

Implementar

Python SDK

Biblioteca Python OpenAI padrão, substituição direta

Instalar

Referência da API

Documentação completa de endpoints e parâmetros

Ler documentação

Preços

Preços baseados em utilização, lote com 50% de desconto

Ver preços

Começar

Pronto para integrar o Qwen 3.6? Começa com o nível gratuito, escala com preços de $0.40/M de tokens

Começa a conversar gratuitamente e depois integra via API compatível com OpenAI. Substituição direta com preserve_thinking para fluxos de trabalho agênticos. DashScope a $0.40/$2.40 por milhão de tokens ou nível gratuito OpenRouter - sem cartão de crédito necessário.

Começar a Conversar Documentação da API