Qwen 3.6 API

API compatibile con OpenAI e preserve_thinking - 12 volte più economico di Claude Opus 4.6

Accedi a Qwen 3.6 Plus, Max e modelli open-weight tramite un'API compatibile con OpenAI. I prezzi DashScope partono da $0,40 per milione di token in input e $2,40 per milione di token in output per qwen-plus, rendendolo circa 12 volte più economico di Claude Opus 4.6. Sostituzione diretta per le integrazioni OpenAI esistenti con il parametro preserve_thinking per mantenere lo stato di ragionamento nei cicli agentici. Finestra di contesto da 1M con fino a 65.536 token di output. Disponibile tramite DashScope e OpenRouter con livello gratuito.

Guida API

Integra Qwen 3.6 nelle tue applicazioni con modifiche minime al codice

L'API di Qwen 3.6 segue il formato chat completions di OpenAI, rendendola una sostituzione diretta per le integrazioni esistenti. L'estensione preserve_thinking aggiunge capacità agentiche senza compromettere la compatibilità. L'invocazione batch su DashScope costa il 50% del prezzo in tempo reale.

Compatibilità OpenAI

Endpoint standard chat completions con messaggi, strumenti e supporto streaming. Passa da OpenAI cambiando solo l'URL base e la chiave API - nessuna modifica al codice. Supporta chiamate a funzioni, modalità JSON, output strutturati e input visivi/multimodali. Compatibile con Claude Code, OpenClaw, Aider, Continue.dev e qualsiasi strumento che supporta il formato API OpenAI. La finestra di contesto da 1M supporta fino a 65.536 token di output per richiesta.

Prezzi DashScope

Accesso API diretto tramite la piattaforma DashScope di Alibaba Cloud con prezzi competitivi. qwen-plus: $0,40 per milione di token in input, $2,40 per milione di token in output - circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti. Invocazione batch disponibile al 50% del prezzo in tempo reale per carichi non sensibili alla latenza come elaborazione dati, valutazione e generazione in blocco. Registrati per una chiave API su dashscope.aliyuncs.com.

Integrazione OpenRouter

Accedi ai modelli Qwen 3.6 tramite l'API unificata di OpenRouter insieme a oltre 200 altri modelli. Livello gratuito disponibile su qwen/qwen3.6-plus:free senza carta di credito. Il livello a pagamento usa prezzi pass-through più una commissione del 5,5%. Una singola chiave API per accesso multi-provider con fallback automatico e bilanciamento del carico. OpenRouter gestisce i limiti di frequenza e fornisce analisi di utilizzo per tutti i tuoi provider.

Parametro preserve_thinking

Estensione API unica nel suo genere che mantiene lo stato di ragionamento interno del modello tra le iterazioni del ciclo agentivo. Imposta preserve_thinking: true nella tua richiesta API per ridurre il ragionamento ridondante nei workflow multi-step. Questo migliora la precisione e riduce il consumo di token nelle pipeline agentiche del 15-30% su attività multi-step tipiche. Essenziale per costruire cicli agentici affidabili con Claude Code, OpenClaw e framework agentici personalizzati.

Invocazione batch (50% di sconto)

DashScope offre l'invocazione batch al 50% del prezzo in tempo reale per carichi che non richiedono risposte immediate. Invia batch di richieste e recupera i risultati in modo asincrono. Ideale per elaborazione dataset, valutazione modelli, pipeline di generazione contenuti e qualsiasi workflow dove la latenza non è critica. I job batch supportano lo stesso formato API delle richieste in tempo reale.

Finestra di contesto da 1M

Qwen 3.6 Plus supporta una finestra di contesto da 1M di token - sufficiente per elaborare intere codebase, lunghi articoli di ricerca, documenti legali e conversazioni multi-turno estese in un singolo passaggio. Combinata con fino a 65.536 token di output, permette di generare file completi, analisi dettagliate e report esaustivi senza troncamento. La finestra di contesto è disponibile sia su DashScope che su OpenRouter.

Supporto SDK e framework

Funziona con qualsiasi SDK compatibile con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e altri. Integrazioni LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponibili immediatamente. Nessun SDK personalizzato richiesto - basta cambiare l'URL base. L'SDK Python di DashScope offre anche accesso nativo con funzionalità aggiuntive come gestione batch e monitoraggio dell'utilizzo.

Opzione API self-hosted

Per i team che necessitano di controllo completo sui dati, distribuisci i modelli open-weight di Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers per creare il tuo endpoint API compatibile con OpenAI. Stesso formato API di DashScope e OpenRouter, quindi il codice della tua applicazione funziona senza modifiche. Zero costi per token dopo l'investimento hardware.

Riferimento API

Avvio rapido con l'API Qwen 3.6

Endpoint essenziali, prezzi, parametri e configurazione per iniziare con l'API Qwen 3.6 tramite DashScope o OpenRouter.

Endpoint e funzionalità principali

  • POST /v1/chat/completions - Chat completions (streaming supportato)
  • POST /v1/embeddings - Embedding di testo
  • GET /v1/models - Elenco modelli disponibili
  • preserve_thinking: true - Abilita la persistenza dello stato di ragionamento
  • Finestra di contesto 1M, fino a 65.536 token di output
  • Chiamata funzioni, modalità JSON, output strutturati, visione

Prezzi (DashScope)

  • qwen-plus input: $0,40 per milione di token
  • qwen-plus output: $2,40 per milione di token
  • Invocazione batch: 50% del prezzo in tempo reale
  • Circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti
  • Livello gratuito OpenRouter: qwen/qwen3.6-plus:free (senza carta di credito)
  • OpenRouter a pagamento: prezzo pass-through + commissione 5,5%

Modelli disponibili

  • qwen-3.6-plus - Modello di punta, contesto 1M, preserve_thinking
  • qwen-3.6-max - Ragionamento avanzato, multimodale
  • qwen-3.6-27b - Open-weight denso, migliori prestazioni coding
  • qwen-3.6-35b-a3b - Open-weight MoE, conveniente
  • Self-hosted tramite vLLM, SGLang, KTransformers

Ecosistema Qwen

Un formato API, più punti di accesso, prezzi leader del settore

Accedi a Qwen 3.6 tramite DashScope ($0,40/$2,40 per M token), OpenRouter (livello gratuito disponibile) o vLLM self-hosted - tutti con lo stesso formato API compatibile con OpenAI e supporto preserve_thinking.

DashScope

API diretta, $0,40/$2,40 per M token

Registrati

OpenRouter

API unificata con livello gratuito disponibile

Inizia

vLLM self-hosted

Esegui il tuo endpoint API, zero costi per token

Distribuisci

Python SDK

Libreria Python OpenAI standard, sostituzione diretta

Installa

Riferimento API

Documentazione completa endpoint e parametri

Leggi docs

Prezzi

Prezzi a consumo, batch al 50% di sconto

Vedi prezzi

Per iniziare

Pronto a integrare Qwen 3.6? Inizia con il livello gratuito, scala con prezzi a $0,40/M token

Inizia a chattare gratis, poi integra tramite l'API compatibile con OpenAI. Sostituzione diretta con preserve_thinking per workflow agentici. DashScope a $0,40/$2,40 per milione di token o livello gratuito OpenRouter - nessuna carta di credito richiesta.