API de Qwen 3.6

API compatible con OpenAI con preserve_thinking - 12 veces más barata que Claude Opus 4.6

Accede a Qwen 3.6 Plus, Max y modelos de pesos abiertos a través de una API compatible con OpenAI. Los precios de DashScope empiezan en $0,40 por millón de tokens de entrada y $2,40 por millón de tokens de salida para qwen-plus, lo que la hace aproximadamente 12 veces más barata que Claude Opus 4.6. Sustitución directa para integraciones existentes de OpenAI con el parámetro preserve_thinking para mantener el estado de razonamiento en bucles de agentes. Ventana de contexto de 1M con hasta 65.536 tokens de salida. Disponible a través de DashScope directo y OpenRouter con nivel gratuito de vista previa.

Guía de la API

Integra Qwen 3.6 en tus aplicaciones con cambios mínimos de código

La API de Qwen 3.6 sigue el formato de completado de chat de OpenAI, lo que la convierte en un reemplazo directo para integraciones existentes. La extensión preserve_thinking añade capacidades agénticas sin romper la compatibilidad. La invocación por lotes en DashScope funciona al 50% del precio en tiempo real.

Compatibilidad con OpenAI

Endpoint estándar de completado de chat con mensajes, herramientas y soporte de streaming. Cambia desde OpenAI modificando solo la URL base y la clave API, sin cambios de código. Soporta llamadas a funciones, modo JSON, salidas estructuradas y entradas de visión/multimodales. Compatible con Claude Code, OpenClaw, Aider, Continue.dev y cualquier herramienta que soporte el formato de API de OpenAI. La ventana de contexto de 1M soporta hasta 65.536 tokens de salida por solicitud.

Precios de DashScope

Acceso directo a la API a través de la plataforma DashScope de Alibaba Cloud con precios competitivos. qwen-plus: $0,40 por millón de tokens de entrada, $2,40 por millón de tokens de salida, aproximadamente 12 veces más barato que Claude Opus 4.6 para tareas equivalentes. Invocación por lotes disponible al 50% del precio en tiempo real para cargas de trabajo no sensibles a la latencia como procesamiento de datos, evaluación y generación masiva. Regístrate para obtener una clave API en dashscope.aliyuncs.com.

Integración con OpenRouter

Accede a los modelos Qwen 3.6 a través de la API unificada de OpenRouter junto con más de 200 modelos. Nivel gratuito de vista previa disponible en qwen/qwen3.6-plus:free sin tarjeta de crédito. El nivel de pago usa precios de paso más una comisión del 5,5%. Una sola clave API para acceso multiproveedor con respaldo automático y balanceo de carga. OpenRouter gestiona los límites de uso y proporciona analíticas de consumo en todos tus proveedores de modelos.

Parámetro preserve_thinking

Extensión de API pionera que mantiene el estado de razonamiento interno del modelo entre iteraciones del bucle de agentes. Establece preserve_thinking: true en tu solicitud de API para reducir el re-razonamiento redundante en flujos de trabajo de varios pasos. Esto mejora la precisión y reduce el consumo de tokens en pipelines agénticos entre un 15-30% en tareas típicas de varios pasos. Esencial para construir bucles de agentes fiables con Claude Code, OpenClaw y frameworks agénticos personalizados.

Invocación por lotes (50% de descuento)

DashScope ofrece invocación por lotes al 50% del precio en tiempo real para cargas de trabajo que no requieren respuestas inmediatas. Envía lotes de solicitudes y recupera los resultados de forma asíncrona. Ideal para procesamiento de conjuntos de datos, evaluación de modelos, pipelines de generación de contenido y cualquier flujo de trabajo donde la latencia no sea crítica. Los trabajos por lotes soportan el mismo formato de API que las solicitudes en tiempo real.

Ventana de contexto de 1M

Qwen 3.6 Plus soporta una ventana de contexto de 1M de tokens, suficiente para procesar bases de código completas, artículos de investigación extensos, documentos legales y conversaciones largas de varios turnos en una sola pasada. Combinado con hasta 65.536 tokens de salida, esto permite generar archivos completos, análisis detallados e informes exhaustivos sin truncamiento. La ventana de contexto está disponible tanto en DashScope como en OpenRouter.

Soporte de SDK y frameworks

Funciona con cualquier SDK compatible con OpenAI: Python (openai), Node.js (openai), Go, Rust, Java y más. Integraciones con LangChain, LlamaIndex, AutoGen, CrewAI y Semantic Kernel disponibles de serie. No se requiere SDK personalizado, solo cambia la URL base. El SDK de Python de DashScope también proporciona acceso nativo con funciones adicionales como gestión de lotes y seguimiento de uso.

Opción de API autoalojada

Para equipos que necesitan control total de los datos, despliega los modelos de pesos abiertos de Qwen 3.6 (27B, 35B A3B) con vLLM, SGLang o KTransformers para crear tu propio endpoint de API compatible con OpenAI. Mismo formato de API que DashScope y OpenRouter, así que el código de tu aplicación funciona sin cambios. Sin coste por token tras la inversión en hardware.

Referencia de la API

Inicio rápido con la API de Qwen 3.6

Endpoints esenciales, precios, parámetros y configuración para empezar con la API de Qwen 3.6 a través de DashScope u OpenRouter.

Endpoints y funciones clave

  • POST /v1/chat/completions - Completado de chat (streaming soportado)
  • POST /v1/embeddings - Embeddings de texto
  • GET /v1/models - Listar modelos disponibles
  • preserve_thinking: true - Activar persistencia del estado de razonamiento
  • Ventana de contexto de 1M, hasta 65.536 tokens de salida
  • Llamadas a funciones, modo JSON, salidas estructuradas, visión

Precios (DashScope)

  • Entrada qwen-plus: $0,40 por millón de tokens
  • Salida qwen-plus: $2,40 por millón de tokens
  • Invocación por lotes: 50% del precio en tiempo real
  • ~12 veces más barato que Claude Opus 4.6 para tareas equivalentes
  • Nivel gratuito de OpenRouter: qwen/qwen3.6-plus:free (sin tarjeta de crédito)
  • OpenRouter de pago: precio de paso + comisión del 5,5%

Modelos disponibles

  • qwen-3.6-plus - Modelo insignia, contexto de 1M, preserve_thinking
  • qwen-3.6-max - Razonamiento avanzado, multimodal
  • qwen-3.6-27b - Pesos abiertos denso, mejor rendimiento en programación
  • qwen-3.6-35b-a3b - Pesos abiertos MoE, coste-eficiente
  • Autoalojado con vLLM, SGLang, KTransformers

Ecosistema Qwen

Un formato de API, múltiples puntos de acceso, precios líderes en el sector

Accede a Qwen 3.6 a través de DashScope ($0,40/$2,40 por M de tokens), OpenRouter (nivel gratuito disponible) o vLLM autoalojado, todo usando el mismo formato de API compatible con OpenAI con soporte de preserve_thinking.

DashScope

API directa, $0,40/$2,40 por M de tokens

Registrarse

OpenRouter

API unificada con nivel gratuito disponible

Empezar

vLLM autoalojado

Tu propio endpoint de API, sin coste por token

Desplegar

SDK de Python

Librería estándar de Python de OpenAI, reemplazo directo

Instalar

Referencia de la API

Documentación completa de endpoints y parámetros

Leer docs

Precios

Precios por uso, lotes al 50% de descuento

Ver precios

Primeros pasos

¿Listo para integrar Qwen 3.6? Empieza con el nivel gratuito, escala con precios de $0,40/M de tokens

Empieza a chatear gratis y luego integra a través de la API compatible con OpenAI. Reemplazo directo con preserve_thinking para flujos de trabajo agénticos. DashScope a $0,40/$2,40 por millón de tokens u OpenRouter con nivel gratuito, sin tarjeta de crédito.