Qwen 3.6 API

API compatibile con OpenAI e preserve_thinking - 12 volte più economico di Claude Opus 4.6

Accedi a Qwen 3.6 Plus, Max e modelli open-weight tramite un'API compatibile con OpenAI. I prezzi DashScope partono da $0,40 per milione di token in input e $2,40 per milione di token in output per qwen-plus, rendendolo circa 12 volte più economico di Claude Opus 4.6. Sostituzione diretta per le integrazioni OpenAI esistenti con il parametro preserve_thinking per mantenere lo stato di ragionamento nei cicli agentici. Finestra di contesto da 1M con fino a 65.536 token di output. Disponibile tramite DashScope e OpenRouter con livello gratuito.

Inizia a chattare Vedi documentazione API

Guida API

Integra Qwen 3.6 nelle tue applicazioni con modifiche minime al codice

L'API di Qwen 3.6 segue il formato chat completions di OpenAI, rendendola una sostituzione diretta per le integrazioni esistenti. L'estensione preserve_thinking aggiunge capacità agentiche senza compromettere la compatibilità. L'invocazione batch su DashScope costa il 50% del prezzo in tempo reale.

Compatibilità OpenAI

Endpoint standard chat completions con messaggi, strumenti e supporto streaming. Passa da OpenAI cambiando solo l'URL base e la chiave API - nessuna modifica al codice. Supporta chiamate a funzioni, modalità JSON, output strutturati e input visivi/multimodali. Compatibile con Claude Code, OpenClaw, Aider, Continue.dev e qualsiasi strumento che supporta il formato API OpenAI. La finestra di contesto da 1M supporta fino a 65.536 token di output per richiesta.

Prezzi DashScope

Accesso API diretto tramite la piattaforma DashScope di Alibaba Cloud con prezzi competitivi. qwen-plus: $0,40 per milione di token in input, $2,40 per milione di token in output - circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti. Invocazione batch disponibile al 50% del prezzo in tempo reale per carichi non sensibili alla latenza come elaborazione dati, valutazione e generazione in blocco. Registrati per una chiave API su dashscope.aliyuncs.com.

Integrazione OpenRouter

Accedi ai modelli Qwen 3.6 tramite l'API unificata di OpenRouter insieme a oltre 200 altri modelli. Livello gratuito disponibile su qwen/qwen3.6-plus:free senza carta di credito. Il livello a pagamento usa prezzi pass-through più una commissione del 5,5%. Una singola chiave API per accesso multi-provider con fallback automatico e bilanciamento del carico. OpenRouter gestisce i limiti di frequenza e fornisce analisi di utilizzo per tutti i tuoi provider.

Parametro preserve_thinking

Estensione API unica nel suo genere che mantiene lo stato di ragionamento interno del modello tra le iterazioni del ciclo agentivo. Imposta preserve_thinking: true nella tua richiesta API per ridurre il ragionamento ridondante nei workflow multi-step. Questo migliora la precisione e riduce il consumo di token nelle pipeline agentiche del 15-30% su attività multi-step tipiche. Essenziale per costruire cicli agentici affidabili con Claude Code, OpenClaw e framework agentici personalizzati.

Invocazione batch (50% di sconto)

DashScope offre l'invocazione batch al 50% del prezzo in tempo reale per carichi che non richiedono risposte immediate. Invia batch di richieste e recupera i risultati in modo asincrono. Ideale per elaborazione dataset, valutazione modelli, pipeline di generazione contenuti e qualsiasi workflow dove la latenza non è critica. I job batch supportano lo stesso formato API delle richieste in tempo reale.

Finestra di contesto da 1M

Qwen 3.6 Plus supporta una finestra di contesto da 1M di token - sufficiente per elaborare intere codebase, lunghi articoli di ricerca, documenti legali e conversazioni multi-turno estese in un singolo passaggio. Combinata con fino a 65.536 token di output, permette di generare file completi, analisi dettagliate e report esaustivi senza troncamento. La finestra di contesto è disponibile sia su DashScope che su OpenRouter.

Supporto SDK e framework

Funziona con qualsiasi SDK compatibile con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java e altri. Integrazioni LangChain, LlamaIndex, AutoGen, CrewAI e Semantic Kernel disponibili immediatamente. Nessun SDK personalizzato richiesto - basta cambiare l'URL base. L'SDK Python di DashScope offre anche accesso nativo con funzionalità aggiuntive come gestione batch e monitoraggio dell'utilizzo.

Opzione API self-hosted

Per i team che necessitano di controllo completo sui dati, distribuisci i modelli open-weight di Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers per creare il tuo endpoint API compatibile con OpenAI. Stesso formato API di DashScope e OpenRouter, quindi il codice della tua applicazione funziona senza modifiche. Zero costi per token dopo l'investimento hardware.

Riferimento API

Avvio rapido con l'API Qwen 3.6

Endpoint essenziali, prezzi, parametri e configurazione per iniziare con l'API Qwen 3.6 tramite DashScope o OpenRouter.

Endpoint e funzionalità principali

POST /v1/chat/completions - Chat completions (streaming supportato)
POST /v1/embeddings - Embedding di testo
GET /v1/models - Elenco modelli disponibili
preserve_thinking: true - Abilita la persistenza dello stato di ragionamento
Finestra di contesto 1M, fino a 65.536 token di output
Chiamata funzioni, modalità JSON, output strutturati, visione

Prezzi (DashScope)

qwen-plus input: $0,40 per milione di token
qwen-plus output: $2,40 per milione di token
Invocazione batch: 50% del prezzo in tempo reale
Circa 12 volte più economico di Claude Opus 4.6 per attività equivalenti
Livello gratuito OpenRouter: qwen/qwen3.6-plus:free (senza carta di credito)
OpenRouter a pagamento: prezzo pass-through + commissione 5,5%

Modelli disponibili

qwen-3.6-plus - Modello di punta, contesto 1M, preserve_thinking
qwen-3.6-max - Ragionamento avanzato, multimodale
qwen-3.6-27b - Open-weight denso, migliori prestazioni coding
qwen-3.6-35b-a3b - Open-weight MoE, conveniente
Self-hosted tramite vLLM, SGLang, KTransformers

Inizia a chattare Documentazione API

Per iniziare

Inizia a sviluppare con l'API Qwen 3.6 in pochi minuti

Ottieni la tua chiave API e fai la tua prima richiesta. Il formato compatibile con OpenAI ti permette di iniziare con strumenti e SDK familiari.

Avvio rapido DashScope

Registrati e ottieni la tua chiave API da Alibaba Cloud DashScope

Configurazione OpenRouter

Accedi a Qwen 3.6 tramite OpenRouter - livello gratuito disponibile

Guida Python SDK

Usa l'SDK Python standard di OpenAI con Qwen 3.6

Guida Node.js SDK

Integra Qwen 3.6 nelle applicazioni Node.js

Guida invocazione batch

Invia job batch al 50% del prezzo per carichi in blocco

tag

Calcolatore prezzi

Stima i costi per il tuo carico rispetto a Claude, GPT-4o, Gemini

Uso avanzato

Costruisci workflow agentici con preserve_thinking e chiamata funzioni

Sfrutta il parametro preserve_thinking, la chiamata funzioni e il contesto da 1M per pipeline agentiche multi-step complesse e applicazioni di produzione.

Framework agentici

Integrazione con LangChain, AutoGen, CrewAI e Semantic Kernel

Guida chiamata funzioni

Chiamata funzioni, protocollo MCP e uso strutturato degli strumenti

Guida streaming

Server-sent events per risposte in tempo reale e avanzamento

Integrazione Claude Code

Usa Qwen 3.6 come backend per Claude Code tramite API

Deployment self-hosted

Distribuisci con vLLM o SGLang per zero costi per token

Ecosistema Qwen

Un formato API, più punti di accesso, prezzi leader del settore

Accedi a Qwen 3.6 tramite DashScope ($0,40/$2,40 per M token), OpenRouter (livello gratuito disponibile) o vLLM self-hosted - tutti con lo stesso formato API compatibile con OpenAI e supporto preserve_thinking.

Esplora tutti i modelli Documentazione API

DashScope

API diretta, $0,40/$2,40 per M token

Registrati

OpenRouter

API unificata con livello gratuito disponibile

Inizia

vLLM self-hosted

Esegui il tuo endpoint API, zero costi per token

Distribuisci

Python SDK

Libreria Python OpenAI standard, sostituzione diretta

Installa

Riferimento API

Documentazione completa endpoint e parametri

Leggi docs

Prezzi

Prezzi a consumo, batch al 50% di sconto

Vedi prezzi

Per iniziare

Pronto a integrare Qwen 3.6? Inizia con il livello gratuito, scala con prezzi a $0,40/M token

Inizia a chattare gratis, poi integra tramite l'API compatibile con OpenAI. Sostituzione diretta con preserve_thinking per workflow agentici. DashScope a $0,40/$2,40 per milione di token o livello gratuito OpenRouter - nessuna carta di credito richiesta.

Inizia a chattare Documentazione API