Qwen 3.6 API
API compatibile con OpenAI e preserve_thinking - 12 volte più economico di Claude Opus 4.6
Accedi a Qwen 3.6 Plus, Max e modelli open-weight tramite un'API compatibile con OpenAI. I prezzi DashScope partono da $0,40 per milione di token in input e $2,40 per milione di token in output per qwen-plus, rendendolo circa 12 volte più economico di Claude Opus 4.6. Sostituzione diretta per le integrazioni OpenAI esistenti con il parametro preserve_thinking per mantenere lo stato di ragionamento nei cicli agentici. Finestra di contesto da 1M con fino a 65.536 token di output. Disponibile tramite DashScope e OpenRouter con livello gratuito.
Guida API
Integra Qwen 3.6 nelle tue applicazioni con modifiche minime al codice
L'API di Qwen 3.6 segue il formato chat completions di OpenAI, rendendola una sostituzione diretta per le integrazioni esistenti. L'estensione preserve_thinking aggiunge capacità agentiche senza compromettere la compatibilità. L'invocazione batch su DashScope costa il 50% del prezzo in tempo reale.
Compatibilità OpenAI
Endpoint standard chat completions con messaggi, strumenti e supporto streaming. Passa da OpenAI cambiando solo l'URL base e la chiave API - nessuna modifica al codice. Supporta chiamate a funzioni, modalità JSON, output strutturati e input visivi/multimodali. Compatibile con Claude Code, OpenClaw, Aider, Continue.dev e qualsiasi strumento che supporta il formato API OpenAI. La finestra di contesto da 1M supporta fino a 65.536 token di output per richiesta.
Prezzi DashScope
Accesso API diretto tramite la piattaforma DashScope di Alibaba Cloud con prezzi competitivi. qwen-plus: $0,40 per milione di token in input, $2,40 per milione di token in output - circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti. Invocazione batch disponibile al 50% del prezzo in tempo reale per carichi non sensibili alla latenza come elaborazione dati, valutazione e generazione in blocco. Registrati per una chiave API su dashscope.aliyuncs.com.
Integrazione OpenRouter
Accedi ai modelli Qwen 3.6 tramite l'API unificata di OpenRouter insieme a oltre 200 altri modelli. Livello gratuito disponibile su qwen/qwen3.6-plus:free senza carta di credito. Il livello a pagamento usa prezzi pass-through più una commissione del 5,5%. Una singola chiave API per accesso multi-provider con fallback automatico e bilanciamento del carico. OpenRouter gestisce i limiti di frequenza e fornisce analisi di utilizzo per tutti i tuoi provider.
Parametro preserve_thinking
Estensione API unica nel suo genere che mantiene lo stato di ragionamento interno del modello tra le iterazioni del ciclo agentivo. Imposta preserve_thinking: true nella tua richiesta API per ridurre il ragionamento ridondante nei workflow multi-step. Questo migliora la precisione e riduce il consumo di token nelle pipeline agentiche del 15-30% su attività multi-step tipiche. Essenziale per costruire cicli agentici affidabili con Claude Code, OpenClaw e framework agentici personalizzati.
Invocazione batch (50% di sconto)
DashScope offre l'invocazione batch al 50% del prezzo in tempo reale per carichi che non richiedono risposte immediate. Invia batch di richieste e recupera i risultati in modo asincrono. Ideale per elaborazione dataset, valutazione modelli, pipeline di generazione contenuti e qualsiasi workflow dove la latenza non è critica. I job batch supportano lo stesso formato API delle richieste in tempo reale.
Finestra di contesto da 1M
Qwen 3.6 Plus supporta una finestra di contesto da 1M di token - sufficiente per elaborare intere codebase, lunghi articoli di ricerca, documenti legali e conversazioni multi-turno estese in un singolo passaggio. Combinata con fino a 65.536 token di output, permette di generare file completi, analisi dettagliate e report esaustivi senza troncamento. La finestra di contesto è disponibile sia su DashScope che su OpenRouter.
Supporto SDK e framework
Funziona con qualsiasi SDK compatibile con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e altri. Integrazioni LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponibili immediatamente. Nessun SDK personalizzato richiesto - basta cambiare l'URL base. L'SDK Python di DashScope offre anche accesso nativo con funzionalità aggiuntive come gestione batch e monitoraggio dell'utilizzo.
Opzione API self-hosted
Per i team che necessitano di controllo completo sui dati, distribuisci i modelli open-weight di Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers per creare il tuo endpoint API compatibile con OpenAI. Stesso formato API di DashScope e OpenRouter, quindi il codice della tua applicazione funziona senza modifiche. Zero costi per token dopo l'investimento hardware.
Riferimento API
Avvio rapido con l'API Qwen 3.6
Endpoint essenziali, prezzi, parametri e configurazione per iniziare con l'API Qwen 3.6 tramite DashScope o OpenRouter.
Endpoint e funzionalità principali
- POST /v1/chat/completions - Chat completions (streaming supportato)
- POST /v1/embeddings - Embedding di testo
- GET /v1/models - Elenco modelli disponibili
- preserve_thinking: true - Abilita la persistenza dello stato di ragionamento
- Finestra di contesto 1M, fino a 65.536 token di output
- Chiamata funzioni, modalità JSON, output strutturati, visione
Prezzi (DashScope)
- qwen-plus input: $0,40 per milione di token
- qwen-plus output: $2,40 per milione di token
- Invocazione batch: 50% del prezzo in tempo reale
- Circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti
- Livello gratuito OpenRouter: qwen/qwen3.6-plus:free (senza carta di credito)
- OpenRouter a pagamento: prezzo pass-through + commissione 5,5%
Modelli disponibili
- qwen-3.6-plus - Modello di punta, contesto 1M, preserve_thinking
- qwen-3.6-max - Ragionamento avanzato, multimodale
- qwen-3.6-27b - Open-weight denso, migliori prestazioni coding
- qwen-3.6-35b-a3b - Open-weight MoE, conveniente
- Self-hosted tramite vLLM, SGLang, KTransformers
Per iniziare
Inizia a sviluppare con l'API Qwen 3.6 in pochi minuti
Ottieni la tua chiave API e fai la tua prima richiesta. Il formato compatibile con OpenAI ti permette di iniziare con strumenti e SDK familiari.
Registrati e ottieni la tua chiave API da Alibaba Cloud DashScope
Accedi a Qwen 3.6 tramite OpenRouter - livello gratuito disponibile
Usa l'SDK Python standard di OpenAI con Qwen 3.6
Integra Qwen 3.6 nelle applicazioni Node.js
Invia job batch al 50% del prezzo per carichi in blocco
Stima i costi per il tuo carico rispetto a Claude, GPT-4o, Gemini
Uso avanzato
Costruisci workflow agentici con preserve_thinking e chiamata funzioni
Sfrutta il parametro preserve_thinking, la chiamata funzioni e il contesto da 1M per pipeline agentiche multi-step complesse e applicazioni di produzione.
Integrazione con LangChain, AutoGen, CrewAI e Semantic Kernel
Chiamata funzioni, protocollo MCP e uso strutturato degli strumenti
Server-sent events per risposte in tempo reale e avanzamento
Usa Qwen 3.6 come backend per Claude Code tramite API
Distribuisci con vLLM o SGLang per zero costi per token
Ecosistema Qwen
Un formato API, più punti di accesso, prezzi leader del settore
Accedi a Qwen 3.6 tramite DashScope ($0,40/$2,40 per M token), OpenRouter (livello gratuito disponibile) o vLLM self-hosted - tutti con lo stesso formato API compatibile con OpenAI e supporto preserve_thinking.
Per iniziare
Pronto a integrare Qwen 3.6? Inizia con il livello gratuito, scala con prezzi a $0,40/M token
Inizia a chattare gratis, poi integra tramite l'API compatibile con OpenAI. Sostituzione diretta con preserve_thinking per workflow agentici. DashScope a $0,40/$2,40 per milione di token o livello gratuito OpenRouter - nessuna carta di credito richiesta.