API de Qwen 3.6
API compatible con OpenAI con preserve_thinking - 12x más barato que Claude Opus 4.6
Accede a Qwen 3.6 Plus, Max y modelos de pesos abiertos a través de una API compatible con OpenAI. Los precios de DashScope comienzan en $0.40 por millón de tokens de entrada y $2.40 por millón de tokens de salida para qwen-plus, haciéndolo aproximadamente 12x más barato que Claude Opus 4.6. Reemplazo directo para integraciones existentes de OpenAI con el parámetro preserve_thinking para mantener el estado de razonamiento entre ciclos de agentes. Ventana de contexto de 1M con hasta 65,536 tokens de salida. Disponible vía DashScope directo y OpenRouter con nivel de vista previa gratuito.
Guía de API
Integra Qwen 3.6 en tus aplicaciones con cambios mínimos de código
La API de Qwen 3.6 sigue el formato de completaciones de chat de OpenAI, haciéndola un reemplazo directo para integraciones existentes. La extensión preserve_thinking agrega capacidades agénticas sin romper la compatibilidad. La invocación por lotes en DashScope corre al 50% del precio en tiempo real.
Compatibilidad con OpenAI
Endpoint estándar de completaciones de chat con mensajes, herramientas y soporte de streaming. Cambia desde OpenAI modificando la URL base y la clave API - sin cambios de código requeridos. Soporta llamadas a funciones, modo JSON, salidas estructuradas y entradas de visión/multimodales. Compatible con Claude Code, OpenClaw, Aider, Continue.dev y cualquier herramienta que soporte el formato de API de OpenAI. La ventana de contexto de 1M soporta hasta 65,536 tokens de salida por solicitud.
Precios de DashScope
Acceso directo a la API a través de la plataforma DashScope de Alibaba Cloud con precios competitivos. qwen-plus: $0.40 por millón de tokens de entrada, $2.40 por millón de tokens de salida - aproximadamente 12x más barato que Claude Opus 4.6 para tareas equivalentes. Invocación por lotes disponible al 50% del precio en tiempo real para cargas de trabajo no sensibles a la latencia como procesamiento de datos, evaluación y generación masiva. Regístrate para obtener una clave API en dashscope.aliyuncs.com.
Integración con OpenRouter
Accede a los modelos Qwen 3.6 a través de la API unificada de OpenRouter junto con más de 200 modelos. Nivel de vista previa gratuito disponible en qwen/qwen3.6-plus:free sin tarjeta de crédito. El nivel de pago usa precios de paso más una comisión del 5.5%. Una sola clave API para acceso multi-proveedor con respaldo automático y balanceo de carga. OpenRouter maneja los límites de tasa y proporciona análisis de uso en todos tus proveedores de modelos.
Parámetro preserve_thinking
Extensión de API pionera que mantiene el estado de razonamiento interno del modelo entre iteraciones del ciclo de agentes. Configura preserve_thinking: true en tu solicitud API para reducir el re-razonamiento redundante en flujos de trabajo de múltiples pasos. Esto mejora la precisión y reduce el uso de tokens en pipelines agénticos en un 15-30% en tareas típicas de múltiples pasos. Esencial para construir ciclos de agentes confiables con Claude Code, OpenClaw y frameworks agénticos personalizados.
Invocación por lotes (50% de descuento)
DashScope ofrece invocación por lotes al 50% del precio en tiempo real para cargas de trabajo que no requieren respuestas inmediatas. Envía lotes de solicitudes y recupera resultados de forma asíncrona. Ideal para procesamiento de datasets, evaluación de modelos, pipelines de generación de contenido y cualquier flujo de trabajo donde la latencia no es crítica. Los trabajos por lotes soportan el mismo formato de API que las solicitudes en tiempo real.
Ventana de contexto de 1M
Qwen 3.6 Plus soporta una ventana de contexto de 1M de tokens - suficiente para procesar bases de código completas, artículos de investigación extensos, documentos legales y conversaciones extendidas de múltiples turnos en una sola pasada. Combinado con hasta 65,536 tokens de salida, esto permite generar archivos completos, análisis detallados e informes exhaustivos sin truncamiento. La ventana de contexto está disponible tanto en DashScope como en OpenRouter.
Soporte de SDK y frameworks
Funciona con cualquier SDK compatible con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java y más. Integraciones con LangChain, LlamaIndex, AutoGen, CrewAI y Semantic Kernel disponibles de forma nativa. No se requiere SDK personalizado - solo cambia la URL base. El SDK de Python de DashScope también proporciona acceso nativo con funciones adicionales como gestión de lotes y seguimiento de uso.
Opción de API autoalojada
Para equipos que necesitan control total de datos, despliega modelos de pesos abiertos de Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers para crear tu propio endpoint de API compatible con OpenAI. Mismo formato de API que DashScope y OpenRouter, así que tu código de aplicación funciona sin cambios. Cero costos por token después de la inversión en hardware.
Referencia de API
Inicio rápido con la API de Qwen 3.6
Endpoints esenciales, precios, parámetros y configuración para comenzar con la API de Qwen 3.6 vía DashScope u OpenRouter.
Endpoints y funciones clave
- POST /v1/chat/completions - Completaciones de chat (streaming soportado)
- POST /v1/embeddings - Embeddings de texto
- GET /v1/models - Listar modelos disponibles
- preserve_thinking: true - Habilitar persistencia del estado de razonamiento
- Ventana de contexto de 1M, hasta 65,536 tokens de salida
- Llamadas a funciones, modo JSON, salidas estructuradas, visión
Precios (DashScope)
- qwen-plus entrada: $0.40 por millón de tokens
- qwen-plus salida: $2.40 por millón de tokens
- Invocación por lotes: 50% del precio en tiempo real
- ~12x más barato que Claude Opus 4.6 para tareas equivalentes
- Nivel gratuito OpenRouter: qwen/qwen3.6-plus:free (sin tarjeta de crédito)
- OpenRouter de pago: precio de paso + comisión del 5.5%
Modelos disponibles
- qwen-3.6-plus - Insignia, 1M de contexto, preserve_thinking
- qwen-3.6-max - Razonamiento avanzado, multimodal
- qwen-3.6-27b - Pesos abiertos denso, mejor rendimiento en programación
- qwen-3.6-35b-a3b - Pesos abiertos MoE, costo-efectivo
- Autoalojado vía vLLM, SGLang, KTransformers
Primeros pasos
Empieza a construir con la API de Qwen 3.6 en minutos
Obtén tu clave API y haz tu primera solicitud. El formato compatible con OpenAI significa que puedes empezar con herramientas y SDKs familiares.
Regístrate y obtén tu clave API de Alibaba Cloud DashScope
Accede a Qwen 3.6 a través de OpenRouter - nivel gratuito disponible
Usa el SDK estándar de Python de OpenAI con Qwen 3.6
Integra Qwen 3.6 en aplicaciones Node.js
Envía trabajos por lotes al 50% del precio para cargas masivas
Estima costos para tu carga de trabajo vs Claude, GPT-4o, Gemini
Uso avanzado
Construye flujos agénticos con preserve_thinking y llamadas a herramientas
Aprovecha el parámetro preserve_thinking, llamadas a funciones y contexto de 1M para pipelines complejos de agentes de múltiples pasos y aplicaciones en producción.
Integración con LangChain, AutoGen, CrewAI y Semantic Kernel
Llamadas a funciones, protocolo MCP y uso estructurado de herramientas
Eventos enviados por servidor para respuestas en tiempo real y progreso
Usa Qwen 3.6 como backend para Claude Code vía API
Despliega con vLLM o SGLang para cero costos por token
Ecosistema Qwen
Un formato de API, múltiples puntos de acceso, precios líderes en la industria
Accede a Qwen 3.6 a través de DashScope ($0.40/$2.40 por M de tokens), OpenRouter (nivel gratuito disponible) o vLLM autoalojado - todo usando el mismo formato de API compatible con OpenAI con soporte de preserve_thinking.
Primeros pasos
¿Listo para integrar Qwen 3.6? Empieza con el nivel gratuito, escala con precios de $0.40/M de tokens
Empieza a chatear gratis, luego integra vía la API compatible con OpenAI. Reemplazo directo con preserve_thinking para flujos agénticos. DashScope a $0.40/$2.40 por millón de tokens u OpenRouter nivel gratuito - sin tarjeta de crédito.