API de Qwen 3.6
API compatible con OpenAI con preserve_thinking - 12 veces más barata que Claude Opus 4.6
Accede a Qwen 3.6 Plus, Max y modelos de pesos abiertos a través de una API compatible con OpenAI. Los precios de DashScope empiezan en $0,40 por millón de tokens de entrada y $2,40 por millón de tokens de salida para qwen-plus, lo que la hace aproximadamente 12 veces más barata que Claude Opus 4.6. Sustitución directa para integraciones existentes de OpenAI con el parámetro preserve_thinking para mantener el estado de razonamiento en bucles de agentes. Ventana de contexto de 1M con hasta 65.536 tokens de salida. Disponible a través de DashScope directo y OpenRouter con nivel gratuito de vista previa.
Guía de la API
Integra Qwen 3.6 en tus aplicaciones con cambios mínimos de código
La API de Qwen 3.6 sigue el formato de completado de chat de OpenAI, lo que la convierte en un reemplazo directo para integraciones existentes. La extensión preserve_thinking añade capacidades agénticas sin romper la compatibilidad. La invocación por lotes en DashScope funciona al 50% del precio en tiempo real.
Compatibilidad con OpenAI
Endpoint estándar de completado de chat con mensajes, herramientas y soporte de streaming. Cambia desde OpenAI modificando solo la URL base y la clave API, sin cambios de código. Soporta llamadas a funciones, modo JSON, salidas estructuradas y entradas de visión/multimodales. Compatible con Claude Code, OpenClaw, Aider, Continue.dev y cualquier herramienta que soporte el formato de API de OpenAI. La ventana de contexto de 1M soporta hasta 65.536 tokens de salida por solicitud.
Precios de DashScope
Acceso directo a la API a través de la plataforma DashScope de Alibaba Cloud con precios competitivos. qwen-plus: $0,40 por millón de tokens de entrada, $2,40 por millón de tokens de salida, aproximadamente 12 veces más barato que Claude Opus 4.6 para tareas equivalentes. Invocación por lotes disponible al 50% del precio en tiempo real para cargas de trabajo no sensibles a la latencia como procesamiento de datos, evaluación y generación masiva. Regístrate para obtener una clave API en dashscope.aliyuncs.com.
Integración con OpenRouter
Accede a los modelos Qwen 3.6 a través de la API unificada de OpenRouter junto con más de 200 modelos. Nivel gratuito de vista previa disponible en qwen/qwen3.6-plus:free sin tarjeta de crédito. El nivel de pago usa precios de paso más una comisión del 5,5%. Una sola clave API para acceso multiproveedor con respaldo automático y balanceo de carga. OpenRouter gestiona los límites de uso y proporciona analíticas de consumo en todos tus proveedores de modelos.
Parámetro preserve_thinking
Extensión de API pionera que mantiene el estado de razonamiento interno del modelo entre iteraciones del bucle de agentes. Establece preserve_thinking: true en tu solicitud de API para reducir el re-razonamiento redundante en flujos de trabajo de varios pasos. Esto mejora la precisión y reduce el consumo de tokens en pipelines agénticos entre un 15-30% en tareas típicas de varios pasos. Esencial para construir bucles de agentes fiables con Claude Code, OpenClaw y frameworks agénticos personalizados.
Invocación por lotes (50% de descuento)
DashScope ofrece invocación por lotes al 50% del precio en tiempo real para cargas de trabajo que no requieren respuestas inmediatas. Envía lotes de solicitudes y recupera los resultados de forma asíncrona. Ideal para procesamiento de conjuntos de datos, evaluación de modelos, pipelines de generación de contenido y cualquier flujo de trabajo donde la latencia no sea crítica. Los trabajos por lotes soportan el mismo formato de API que las solicitudes en tiempo real.
Ventana de contexto de 1M
Qwen 3.6 Plus soporta una ventana de contexto de 1M de tokens, suficiente para procesar bases de código completas, artículos de investigación extensos, documentos legales y conversaciones largas de varios turnos en una sola pasada. Combinado con hasta 65.536 tokens de salida, esto permite generar archivos completos, análisis detallados e informes exhaustivos sin truncamiento. La ventana de contexto está disponible tanto en DashScope como en OpenRouter.
Soporte de SDK y frameworks
Funciona con cualquier SDK compatible con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java y más. Integraciones con LangChain, LlamaIndex, AutoGen, CrewAI y Semantic Kernel disponibles de serie. No se requiere SDK personalizado, solo cambia la URL base. El SDK de Python de DashScope también proporciona acceso nativo con funciones adicionales como gestión de lotes y seguimiento de uso.
Opción de API autoalojada
Para equipos que necesitan control total de los datos, despliega los modelos de pesos abiertos de Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers para crear tu propio endpoint de API compatible con OpenAI. Mismo formato de API que DashScope y OpenRouter, así que el código de tu aplicación funciona sin cambios. Sin coste por token tras la inversión en hardware.
Referencia de la API
Inicio rápido con la API de Qwen 3.6
Endpoints esenciales, precios, parámetros y configuración para empezar con la API de Qwen 3.6 a través de DashScope u OpenRouter.
Endpoints y funciones clave
- POST /v1/chat/completions - Completado de chat (streaming soportado)
- POST /v1/embeddings - Embeddings de texto
- GET /v1/models - Listar modelos disponibles
- preserve_thinking: true - Activar persistencia del estado de razonamiento
- Ventana de contexto de 1M, hasta 65.536 tokens de salida
- Llamadas a funciones, modo JSON, salidas estructuradas, visión
Precios (DashScope)
- Entrada qwen-plus: $0,40 por millón de tokens
- Salida qwen-plus: $2,40 por millón de tokens
- Invocación por lotes: 50% del precio en tiempo real
- ~12 veces más barato que Claude Opus 4.6 para tareas equivalentes
- Nivel gratuito de OpenRouter: qwen/qwen3.6-plus:free (sin tarjeta de crédito)
- OpenRouter de pago: precio de paso + comisión del 5,5%
Modelos disponibles
- qwen-3.6-plus - Modelo insignia, contexto de 1M, preserve_thinking
- qwen-3.6-max - Razonamiento avanzado, multimodal
- qwen-3.6-27b - Pesos abiertos denso, mejor rendimiento en programación
- qwen-3.6-35b-a3b - Pesos abiertos MoE, coste-eficiente
- Autoalojado con vLLM, SGLang, KTransformers
Primeros pasos
Empieza a construir con la API de Qwen 3.6 en minutos
Obtén tu clave API y haz tu primera solicitud. El formato compatible con OpenAI significa que puedes empezar con herramientas y SDKs que ya conoces.
Regístrate y obtén tu clave API en Alibaba Cloud DashScope
Accede a Qwen 3.6 a través de OpenRouter - nivel gratuito disponible
Usa el SDK estándar de Python de OpenAI con Qwen 3.6
Integra Qwen 3.6 en aplicaciones Node.js
Envía trabajos por lotes al 50% del precio para cargas masivas
Estima costes para tu carga de trabajo frente a Claude, GPT-4o, Gemini
Uso avanzado
Construye flujos de trabajo agénticos con preserve_thinking y llamadas a herramientas
Aprovecha el parámetro preserve_thinking, las llamadas a funciones y el contexto de 1M para pipelines complejos de agentes de varios pasos y aplicaciones en producción.
Integración con LangChain, AutoGen, CrewAI y Semantic Kernel
Llamadas a funciones, protocolo MCP y uso estructurado de herramientas
Eventos enviados por el servidor para respuestas en tiempo real y progreso
Usa Qwen 3.6 como backend para Claude Code a través de la API
Despliega con vLLM o SGLang sin coste por token
Ecosistema Qwen
Un formato de API, múltiples puntos de acceso, precios líderes en el sector
Accede a Qwen 3.6 a través de DashScope ($0,40/$2,40 por M de tokens), OpenRouter (nivel gratuito disponible) o vLLM autoalojado, todo usando el mismo formato de API compatible con OpenAI con soporte de preserve_thinking.
Primeros pasos
¿Listo para integrar Qwen 3.6? Empieza con el nivel gratuito, escala con precios de $0,40/M de tokens
Empieza a chatear gratis y luego integra a través de la API compatible con OpenAI. Reemplazo directo con preserve_thinking para flujos de trabajo agénticos. DashScope a $0,40/$2,40 por millón de tokens u OpenRouter con nivel gratuito, sin tarjeta de crédito.