API de Qwen 3.6

API compatible con OpenAI con preserve_thinking - 12x más barato que Claude Opus 4.6

Accede a Qwen 3.6 Plus, Max y modelos de pesos abiertos a través de una API compatible con OpenAI. Los precios de DashScope comienzan en $0.40 por millón de tokens de entrada y $2.40 por millón de tokens de salida para qwen-plus, haciéndolo aproximadamente 12x más barato que Claude Opus 4.6. Reemplazo directo para integraciones existentes de OpenAI con el parámetro preserve_thinking para mantener el estado de razonamiento entre ciclos de agentes. Ventana de contexto de 1M con hasta 65,536 tokens de salida. Disponible vía DashScope directo y OpenRouter con nivel de vista previa gratuito.

Comenzar a chatear Ver documentación API

Guía de API

Integra Qwen 3.6 en tus aplicaciones con cambios mínimos de código

La API de Qwen 3.6 sigue el formato de completaciones de chat de OpenAI, haciéndola un reemplazo directo para integraciones existentes. La extensión preserve_thinking agrega capacidades agénticas sin romper la compatibilidad. La invocación por lotes en DashScope corre al 50% del precio en tiempo real.

Compatibilidad con OpenAI

Endpoint estándar de completaciones de chat con mensajes, herramientas y soporte de streaming. Cambia desde OpenAI modificando la URL base y la clave API - sin cambios de código requeridos. Soporta llamadas a funciones, modo JSON, salidas estructuradas y entradas de visión/multimodales. Compatible con Claude Code, OpenClaw, Aider, Continue.dev y cualquier herramienta que soporte el formato de API de OpenAI. La ventana de contexto de 1M soporta hasta 65,536 tokens de salida por solicitud.

Precios de DashScope

Acceso directo a la API a través de la plataforma DashScope de Alibaba Cloud con precios competitivos. qwen-plus: $0.40 por millón de tokens de entrada, $2.40 por millón de tokens de salida - aproximadamente 12x más barato que Claude Opus 4.6 para tareas equivalentes. Invocación por lotes disponible al 50% del precio en tiempo real para cargas de trabajo no sensibles a la latencia como procesamiento de datos, evaluación y generación masiva. Regístrate para obtener una clave API en dashscope.aliyuncs.com.

Integración con OpenRouter

Accede a los modelos Qwen 3.6 a través de la API unificada de OpenRouter junto con más de 200 modelos. Nivel de vista previa gratuito disponible en qwen/qwen3.6-plus:free sin tarjeta de crédito. El nivel de pago usa precios de paso más una comisión del 5.5%. Una sola clave API para acceso multi-proveedor con respaldo automático y balanceo de carga. OpenRouter maneja los límites de tasa y proporciona análisis de uso en todos tus proveedores de modelos.

Parámetro preserve_thinking

Extensión de API pionera que mantiene el estado de razonamiento interno del modelo entre iteraciones del ciclo de agentes. Configura preserve_thinking: true en tu solicitud API para reducir el re-razonamiento redundante en flujos de trabajo de múltiples pasos. Esto mejora la precisión y reduce el uso de tokens en pipelines agénticos en un 15-30% en tareas típicas de múltiples pasos. Esencial para construir ciclos de agentes confiables con Claude Code, OpenClaw y frameworks agénticos personalizados.

Invocación por lotes (50% de descuento)

DashScope ofrece invocación por lotes al 50% del precio en tiempo real para cargas de trabajo que no requieren respuestas inmediatas. Envía lotes de solicitudes y recupera resultados de forma asíncrona. Ideal para procesamiento de datasets, evaluación de modelos, pipelines de generación de contenido y cualquier flujo de trabajo donde la latencia no es crítica. Los trabajos por lotes soportan el mismo formato de API que las solicitudes en tiempo real.

Ventana de contexto de 1M

Qwen 3.6 Plus soporta una ventana de contexto de 1M de tokens - suficiente para procesar bases de código completas, artículos de investigación extensos, documentos legales y conversaciones extendidas de múltiples turnos en una sola pasada. Combinado con hasta 65,536 tokens de salida, esto permite generar archivos completos, análisis detallados e informes exhaustivos sin truncamiento. La ventana de contexto está disponible tanto en DashScope como en OpenRouter.

Soporte de SDK y frameworks

Funciona con cualquier SDK compatible con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java y más. Integraciones con LangChain, LlamaIndex, AutoGen, CrewAI y Semantic Kernel disponibles de forma nativa. No se requiere SDK personalizado - solo cambia la URL base. El SDK de Python de DashScope también proporciona acceso nativo con funciones adicionales como gestión de lotes y seguimiento de uso.

Opción de API autoalojada

Para equipos que necesitan control total de datos, despliega modelos de pesos abiertos de Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers para crear tu propio endpoint de API compatible con OpenAI. Mismo formato de API que DashScope y OpenRouter, así que tu código de aplicación funciona sin cambios. Cero costos por token después de la inversión en hardware.

Referencia de API

Inicio rápido con la API de Qwen 3.6

Endpoints esenciales, precios, parámetros y configuración para comenzar con la API de Qwen 3.6 vía DashScope u OpenRouter.

Endpoints y funciones clave

POST /v1/chat/completions - Completaciones de chat (streaming soportado)
POST /v1/embeddings - Embeddings de texto
GET /v1/models - Listar modelos disponibles
preserve_thinking: true - Habilitar persistencia del estado de razonamiento
Ventana de contexto de 1M, hasta 65,536 tokens de salida
Llamadas a funciones, modo JSON, salidas estructuradas, visión

Precios (DashScope)

qwen-plus entrada: $0.40 por millón de tokens
qwen-plus salida: $2.40 por millón de tokens
Invocación por lotes: 50% del precio en tiempo real
~12x más barato que Claude Opus 4.6 para tareas equivalentes
Nivel gratuito OpenRouter: qwen/qwen3.6-plus:free (sin tarjeta de crédito)
OpenRouter de pago: precio de paso + comisión del 5.5%

Modelos disponibles

qwen-3.6-plus - Insignia, 1M de contexto, preserve_thinking
qwen-3.6-max - Razonamiento avanzado, multimodal
qwen-3.6-27b - Pesos abiertos denso, mejor rendimiento en programación
qwen-3.6-35b-a3b - Pesos abiertos MoE, costo-efectivo
Autoalojado vía vLLM, SGLang, KTransformers

Comenzar a chatear Documentación API

Primeros pasos

Empieza a construir con la API de Qwen 3.6 en minutos

Obtén tu clave API y haz tu primera solicitud. El formato compatible con OpenAI significa que puedes empezar con herramientas y SDKs familiares.

Inicio rápido DashScope

Regístrate y obtén tu clave API de Alibaba Cloud DashScope

Configuración de OpenRouter

Accede a Qwen 3.6 a través de OpenRouter - nivel gratuito disponible

Guía del SDK de Python

Usa el SDK estándar de Python de OpenAI con Qwen 3.6

Guía del SDK de Node.js

Integra Qwen 3.6 en aplicaciones Node.js

Guía de invocación por lotes

Envía trabajos por lotes al 50% del precio para cargas masivas

tag

Calculadora de precios

Estima costos para tu carga de trabajo vs Claude, GPT-4o, Gemini

Uso avanzado

Construye flujos agénticos con preserve_thinking y llamadas a herramientas

Aprovecha el parámetro preserve_thinking, llamadas a funciones y contexto de 1M para pipelines complejos de agentes de múltiples pasos y aplicaciones en producción.

Frameworks de agentes

Integración con LangChain, AutoGen, CrewAI y Semantic Kernel

Guía de llamadas a herramientas

Llamadas a funciones, protocolo MCP y uso estructurado de herramientas

Guía de streaming

Eventos enviados por servidor para respuestas en tiempo real y progreso

Integración con Claude Code

Usa Qwen 3.6 como backend para Claude Code vía API

Despliegue autoalojado

Despliega con vLLM o SGLang para cero costos por token

Ecosistema Qwen

Un formato de API, múltiples puntos de acceso, precios líderes en la industria

Accede a Qwen 3.6 a través de DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nivel gratuito disponible) o vLLM autoalojado - todo usando el mismo formato de API compatible con OpenAI con soporte de preserve_thinking.

Explorar todos los modelos Documentación API

DashScope

API directa, $0.40/$2.40 por M de tokens

Registrarse

OpenRouter

API unificada con nivel gratuito disponible

Comenzar

vLLM autoalojado

Ejecuta tu propio endpoint API, cero costo por token

Desplegar

SDK de Python

Librería estándar de Python de OpenAI, reemplazo directo

Instalar

Referencia de API

Documentación completa de endpoints y parámetros

Leer docs

Precios

Precios basados en uso, lotes al 50% de descuento

Ver precios

Primeros pasos

¿Listo para integrar Qwen 3.6? Empieza con el nivel gratuito, escala con precios de $0.40/M de tokens

Empieza a chatear gratis, luego integra vía la API compatible con OpenAI. Reemplazo directo con preserve_thinking para flujos agénticos. DashScope a $0.40/$2.40 por millón de tokens u OpenRouter nivel gratuito - sin tarjeta de crédito.

Comenzar a chatear Documentación API