Qwen 3.6 Plus

Contesto da 1M, padronanza agentica - il modello proprietario che supera Claude 4.5 Opus sui task da terminale

Qwen 3.6 Plus è il modello proprietario hosted di Alibaba con una finestra di contesto da 1M di token. Raggiunge il 78.8% su SWE-bench Verified, 61.6 su Terminal-Bench 2.0 (battendo Claude 4.5 Opus a 59.3) e introduce preserve_thinking per loop agentici fluidi. Disponibile tramite API compatibile OpenAI dal 31 marzo 2026.

Capacità

Progettato per workflow agentici e task a contesto lungo

Qwen 3.6 Plus combina una finestra di contesto da 1M di token con il parametro preserve_thinking e benchmark di coding di punta per offrire un modello ottimizzato per pipeline agentiche complesse e multi-step.

Ingegneria software d'élite

78.8% su SWE-bench Verified e 56.6 su SWE-bench Pro. Risolve issue GitHub reali con una comprensione profonda della codebase sull'intera finestra di contesto da 1M.

Padronanza del terminale

61.6 su Terminal-Bench 2.0 - supera Claude 4.5 Opus (59.3). Gestisce workflow complessi multi-step nel terminale, sessioni di debug e amministrazione di sistema con competenza da esperto.

Uso agentico dei tool

57.2 su QwenClawBench e 48.2 su MCPMark per l'orchestrazione dei tool. Il parametro preserve_thinking mantiene lo stato di ragionamento tra le iterazioni del loop agentico senza sprecare token.

Contesto da 1M di token

Elabora intere codebase, paper di ricerca lunghi e conversazioni estese multi-turno. 70.7 su TAU3-Bench dimostra un'ottima capacità di completamento task a contesto lungo.

Comprensione documenti

91.2 su OmniDocBench1.5 e 94.4 su AI2D_TEST. Eccelle nell'analisi di documenti complessi, diagrammi e informazioni visive con alta precisione.

API compatibile OpenAI

Sostituzione diretta per le integrazioni API OpenAI esistenti. Il parametro preserve_thinking estende l'API standard per i casi d'uso agentici senza compromettere la compatibilità.

Punti chiave

Prestazioni agentiche che guidano il settore

Qwen 3.6 Plus raggiunge risultati di punta su ingegneria software, operazioni da terminale, uso dei tool e comprensione documenti.

Risultati di punta

  • SWE-bench Verified: 78.8% - ingegneria software reale
  • Terminal-Bench 2.0: 61.6 - batte Claude 4.5 Opus (59.3)
  • SWE-bench Pro: 56.6 - ingegneria software avanzata
  • QwenClawBench: 57.2 - orchestrazione agentica dei tool
  • MCPMark: 48.2 - uso dei tool con protocollo MCP

Specifiche tecniche

  • Modello proprietario hosted di Alibaba Cloud
  • Finestra di contesto da 1M di token
  • Parametro preserve_thinking per loop agentici
  • API compatibile OpenAI
  • Rilasciato il 31 marzo 2026

Prestazioni

Dominio agentico con contesto da 1M e preserve_thinking

Qwen 3.6 Plus raggiunge il 78.8% su SWE-bench Verified e 61.6 su Terminal-Bench 2.0, stabilendo un nuovo standard per i modelli agentici proprietari con il suo contesto da 1M di token e la capacità preserve_thinking.

Qwen 3.6 Plus dimostra una leadership costante nell'ingegneria software, operazioni da terminale, uso agentico dei tool e comprensione documenti - progettato per workflow complessi multi-step che richiedono ragionamento a contesto lungo.

Grafico comparativo delle prestazioni di Qwen 3.6 Plus su benchmark di coding, agentici e comprensione documenti

SWE-bench Verified: 78.8% - ingegneria software reale

Terminal-Bench 2.0: 61.6 - batte Claude 4.5 Opus (59.3)

SWE-bench Pro: 56.6 - ingegneria software avanzata

QwenClawBench: 57.2 - orchestrazione agentica dei tool

OmniDocBench1.5: 91.2 - comprensione documenti

Confronto benchmark

Qwen 3.6 Plus vs modelli proprietari frontier

Qwen 3.6 Plus è in testa sui benchmark agentici e di ingegneria software, con il parametro preserve_thinking che abilita workflow agentici multi-step fluidi.

Benchmark
Qwen 3.6 Plus
Proprietario
In evidenza
Qwen 3.6 27B
Dense
Claude 4.5 Opus
Proprietario
Qwen 3.6 Max
Proprietario
SWE-bench Verified
Ingegneria software reale
78.8%77.2%--
Terminal-Bench 2.0
Operazioni da terminale
61.659.359.3-
SWE-bench Pro
Ingegneria software avanzata
56.6---
QwenClawBench
Orchestrazione agentica dei tool
57.2---
TAU3-Bench
Completamento task a contesto lungo
70.7---
MCPMark
Uso dei tool con protocollo MCP
48.2---
OmniDocBench1.5
Comprensione documenti
91.2---
AI2D_TEST
Comprensione diagrammi
94.4---

Risultati benchmark dal rilascio ufficiale di Qwen 3.6. Rilasciato il 31 marzo 2026.

preserve_thinking

Mantieni lo stato di ragionamento tra le iterazioni del loop agentico

Il parametro preserve_thinking è una funzionalità API unica nel suo genere che permette ai framework agentici di mantenere lo stato di ragionamento interno del modello tra più iterazioni di chiamate ai tool. Invece di scartare i token chain-of-thought tra uno step e l'altro, preserve_thinking li mantiene attivi, riducendo il ri-ragionamento ridondante e migliorando la precisione nei task multi-step.

  • Mantiene il contesto di ragionamento tra le iterazioni del loop agentico
  • Riduce il ri-ragionamento ridondante nei workflow multi-step
  • API compatibile OpenAI con estensione preserve_thinking
Mantieni lo stato di ragionamento tra le iterazioni del loop agentico

Contesto da 1M

Elabora intere codebase e documenti lunghi in un singolo passaggio

Qwen 3.6 Plus supporta una finestra di contesto da 1M di token, permettendo l'analisi di interi repository, paper di ricerca lunghi e conversazioni estese multi-turno. Combinato con 70.7 su TAU3-Bench e 91.2 su OmniDocBench1.5, eccelle nei task che richiedono una comprensione profonda del contesto lungo.

  • Finestra di contesto da 1M di token per intere codebase
  • 70.7 su TAU3-Bench per il completamento di task a contesto lungo
  • 91.2 su OmniDocBench1.5 per la comprensione documenti

Ecosistema Qwen

Parte della famiglia di modelli Qwen 3.6

Qwen 3.6 Plus è la variante agentica proprietaria dell'ultima famiglia di modelli di Alibaba, ottimizzata per workflow a contesto lungo e uso multi-step dei tool.

Documentazione

Guide complete per integrazione API e workflow agentici

Leggi i docs

Riferimento API

Endpoint compatibili OpenAI con preserve_thinking

Vedi API

Model Card

Specifiche tecniche e risultati delle valutazioni

Vedi dettagli

Prezzi

Prezzi a consumo per l'accesso API

Vedi prezzi

Framework agentici

Guide all'integrazione per LangChain, AutoGen e altri

Inizia

Community

Unisciti alla community di sviluppatori Qwen

Unisciti

Per iniziare

Pronto a sviluppare con Qwen 3.6 Plus?

Inizia a chattare subito gratis, oppure integra tramite l'API compatibile OpenAI con preserve_thinking per workflow agentici di livello flagship.