API de Qwen 3.6

API compatible con OpenAI con preserve_thinking - 12 veces más barata que Claude Opus 4.6

Accede a Qwen 3.6 Plus, Max y modelos de pesos abiertos a través de una API compatible con OpenAI. Los precios de DashScope empiezan en $0,40 por millón de tokens de entrada y $2,40 por millón de tokens de salida para qwen-plus, lo que la hace aproximadamente 12 veces más barata que Claude Opus 4.6. Sustitución directa para integraciones existentes de OpenAI con el parámetro preserve_thinking para mantener el estado de razonamiento en bucles de agentes. Ventana de contexto de 1M con hasta 65.536 tokens de salida. Disponible a través de DashScope directo y OpenRouter con nivel gratuito de vista previa.

Empezar a chatear Ver documentación de la API

Guía de la API

Integra Qwen 3.6 en tus aplicaciones con cambios mínimos de código

La API de Qwen 3.6 sigue el formato de completado de chat de OpenAI, lo que la convierte en un reemplazo directo para integraciones existentes. La extensión preserve_thinking añade capacidades agénticas sin romper la compatibilidad. La invocación por lotes en DashScope funciona al 50% del precio en tiempo real.

Compatibilidad con OpenAI

Endpoint estándar de completado de chat con mensajes, herramientas y soporte de streaming. Cambia desde OpenAI modificando solo la URL base y la clave API, sin cambios de código. Soporta llamadas a funciones, modo JSON, salidas estructuradas y entradas de visión/multimodales. Compatible con Claude Code, OpenClaw, Aider, Continue.dev y cualquier herramienta que soporte el formato de API de OpenAI. La ventana de contexto de 1M soporta hasta 65.536 tokens de salida por solicitud.

Precios de DashScope

Acceso directo a la API a través de la plataforma DashScope de Alibaba Cloud con precios competitivos. qwen-plus: $0,40 por millón de tokens de entrada, $2,40 por millón de tokens de salida, aproximadamente 12 veces más barato que Claude Opus 4.6 para tareas equivalentes. Invocación por lotes disponible al 50% del precio en tiempo real para cargas de trabajo no sensibles a la latencia como procesamiento de datos, evaluación y generación masiva. Regístrate para obtener una clave API en dashscope.aliyuncs.com.

Integración con OpenRouter

Accede a los modelos Qwen 3.6 a través de la API unificada de OpenRouter junto con más de 200 modelos. Nivel gratuito de vista previa disponible en qwen/qwen3.6-plus:free sin tarjeta de crédito. El nivel de pago usa precios de paso más una comisión del 5,5%. Una sola clave API para acceso multiproveedor con respaldo automático y balanceo de carga. OpenRouter gestiona los límites de uso y proporciona analíticas de consumo en todos tus proveedores de modelos.

Parámetro preserve_thinking

Extensión de API pionera que mantiene el estado de razonamiento interno del modelo entre iteraciones del bucle de agentes. Establece preserve_thinking: true en tu solicitud de API para reducir el re-razonamiento redundante en flujos de trabajo de varios pasos. Esto mejora la precisión y reduce el consumo de tokens en pipelines agénticos entre un 15-30% en tareas típicas de varios pasos. Esencial para construir bucles de agentes fiables con Claude Code, OpenClaw y frameworks agénticos personalizados.

Invocación por lotes (50% de descuento)

DashScope ofrece invocación por lotes al 50% del precio en tiempo real para cargas de trabajo que no requieren respuestas inmediatas. Envía lotes de solicitudes y recupera los resultados de forma asíncrona. Ideal para procesamiento de conjuntos de datos, evaluación de modelos, pipelines de generación de contenido y cualquier flujo de trabajo donde la latencia no sea crítica. Los trabajos por lotes soportan el mismo formato de API que las solicitudes en tiempo real.

Ventana de contexto de 1M

Qwen 3.6 Plus soporta una ventana de contexto de 1M de tokens, suficiente para procesar bases de código completas, artículos de investigación extensos, documentos legales y conversaciones largas de varios turnos en una sola pasada. Combinado con hasta 65.536 tokens de salida, esto permite generar archivos completos, análisis detallados e informes exhaustivos sin truncamiento. La ventana de contexto está disponible tanto en DashScope como en OpenRouter.

Soporte de SDK y frameworks

Funciona con cualquier SDK compatible con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java y más. Integraciones con LangChain, LlamaIndex, AutoGen, CrewAI y Semantic Kernel disponibles de serie. No se requiere SDK personalizado, solo cambia la URL base. El SDK de Python de DashScope también proporciona acceso nativo con funciones adicionales como gestión de lotes y seguimiento de uso.

Opción de API autoalojada

Para equipos que necesitan control total de los datos, despliega los modelos de pesos abiertos de Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers para crear tu propio endpoint de API compatible con OpenAI. Mismo formato de API que DashScope y OpenRouter, así que el código de tu aplicación funciona sin cambios. Sin coste por token tras la inversión en hardware.

Referencia de la API

Inicio rápido con la API de Qwen 3.6

Endpoints esenciales, precios, parámetros y configuración para empezar con la API de Qwen 3.6 a través de DashScope u OpenRouter.

Endpoints y funciones clave

POST /v1/chat/completions - Completado de chat (streaming soportado)
POST /v1/embeddings - Embeddings de texto
GET /v1/models - Listar modelos disponibles
preserve_thinking: true - Activar persistencia del estado de razonamiento
Ventana de contexto de 1M, hasta 65.536 tokens de salida
Llamadas a funciones, modo JSON, salidas estructuradas, visión

Precios (DashScope)

Entrada qwen-plus: $0,40 por millón de tokens
Salida qwen-plus: $2,40 por millón de tokens
Invocación por lotes: 50% del precio en tiempo real
~12 veces más barato que Claude Opus 4.6 para tareas equivalentes
Nivel gratuito de OpenRouter: qwen/qwen3.6-plus:free (sin tarjeta de crédito)
OpenRouter de pago: precio de paso + comisión del 5,5%

Modelos disponibles

qwen-3.6-plus - Modelo insignia, contexto de 1M, preserve_thinking
qwen-3.6-max - Razonamiento avanzado, multimodal
qwen-3.6-27b - Pesos abiertos denso, mejor rendimiento en programación
qwen-3.6-35b-a3b - Pesos abiertos MoE, coste-eficiente
Autoalojado con vLLM, SGLang, KTransformers

Empezar a chatear Documentación de la API

Primeros pasos

Empieza a construir con la API de Qwen 3.6 en minutos

Obtén tu clave API y haz tu primera solicitud. El formato compatible con OpenAI significa que puedes empezar con herramientas y SDKs que ya conoces.

Inicio rápido con DashScope

Regístrate y obtén tu clave API en Alibaba Cloud DashScope

Configuración de OpenRouter

Accede a Qwen 3.6 a través de OpenRouter - nivel gratuito disponible

Guía del SDK de Python

Usa el SDK estándar de Python de OpenAI con Qwen 3.6

Guía del SDK de Node.js

Integra Qwen 3.6 en aplicaciones Node.js

Guía de invocación por lotes

Envía trabajos por lotes al 50% del precio para cargas masivas

tag

Calculadora de precios

Estima costes para tu carga de trabajo frente a Claude, GPT-4o, Gemini

Uso avanzado

Construye flujos de trabajo agénticos con preserve_thinking y llamadas a herramientas

Aprovecha el parámetro preserve_thinking, las llamadas a funciones y el contexto de 1M para pipelines complejos de agentes de varios pasos y aplicaciones en producción.

Frameworks de agentes

Integración con LangChain, AutoGen, CrewAI y Semantic Kernel

Guía de llamadas a herramientas

Llamadas a funciones, protocolo MCP y uso estructurado de herramientas

Guía de streaming

Eventos enviados por el servidor para respuestas en tiempo real y progreso

Integración con Claude Code

Usa Qwen 3.6 como backend para Claude Code a través de la API

Despliegue autoalojado

Despliega con vLLM o SGLang sin coste por token

Ecosistema Qwen

Un formato de API, múltiples puntos de acceso, precios líderes en el sector

Accede a Qwen 3.6 a través de DashScope ($0,40/$2,40 por M de tokens), OpenRouter (nivel gratuito disponible) o vLLM autoalojado, todo usando el mismo formato de API compatible con OpenAI con soporte de preserve_thinking.

Explorar todos los modelos Documentación de la API

DashScope

API directa, $0,40/$2,40 por M de tokens

Registrarse

OpenRouter

API unificada con nivel gratuito disponible

Empezar

vLLM autoalojado

Tu propio endpoint de API, sin coste por token

Desplegar

SDK de Python

Librería estándar de Python de OpenAI, reemplazo directo

Instalar

Referencia de la API

Documentación completa de endpoints y parámetros

Leer docs

Precios

Precios por uso, lotes al 50% de descuento

Ver precios

Primeros pasos

¿Listo para integrar Qwen 3.6? Empieza con el nivel gratuito, escala con precios de $0,40/M de tokens

Empieza a chatear gratis y luego integra a través de la API compatible con OpenAI. Reemplazo directo con preserve_thinking para flujos de trabajo agénticos. DashScope a $0,40/$2,40 por millón de tokens u OpenRouter con nivel gratuito, sin tarjeta de crédito.

Empezar a chatear Documentación de la API