Modelos Qwen 3.6

Cuatro modelos, una familia - desde Mac M4 16GB hasta rendimiento de frontera a $0.40/M de tokens

La familia Qwen 3.6 abarca modelos propietarios alojados y lanzamientos de pesos abiertos. Plus entrega 78.8% SWE-bench con 1M de contexto y preserve_thinking a $0.40/$2.40 por millón de tokens (12x más barato que Claude Opus 4.6). Max maneja razonamiento avanzado y tareas multimodales. El modelo denso 27B alcanza 77.2% SWE-bench y 48.2 SkillsBench (superando a Claude 4.5 Opus). El 35B A3B MoE corre en Mac M4 16GB con cuantización Q3 a 20-40 tok/s. Cada modelo comparte la misma base arquitectónica y API compatible con OpenAI.

Familia de modelos

Elige el modelo Qwen 3.6 adecuado para tu caso de uso y presupuesto

Desde despliegue local ligero en una laptop hasta máximo rendimiento alojado con 1M de contexto, la familia Qwen 3.6 cubre cada escala, presupuesto y escenario de despliegue.

Propietarios

Modelos alojados con máximo rendimiento y 1M de contexto

Plus y Max son modelos propietarios disponibles vía API. Ofrecen el mayor rendimiento, ventanas de contexto de 1M, hasta 65,536 tokens de salida y funciones como preserve_thinking exclusivas del nivel alojado. Los precios de DashScope comienzan en $0.40 por millón de tokens de entrada - aproximadamente 12x más barato que Claude Opus 4.6. Invocación por lotes disponible al 50% del precio en tiempo real.

Disponibles vía API compatible con OpenAI a través de DashScope y OpenRouter (nivel gratuito disponible)

Pesos abiertos

Ejecuta en tu propio hardware con control total - licencia Apache 2.0

Los modelos denso 27B y MoE 35B A3B se publican bajo la licencia Apache 2.0. Despliega localmente con Ollama, vLLM, llama.cpp, SGLang o KTransformers. El 27B cabe en 16GB de VRAM con IQ4_XS GGUF y compresión de caché KV. El 35B A3B corre en Mac M4 16GB con cuantización Q3. Sin costos por token, privacidad total de datos y libertad para ajustar.

Disponibles en HuggingFace, Ollama y repositorios GGUF

Qwen 3.6 Plus

Propietario

Modelo propietario insignia con 1M de contexto, preserve_thinking para flujos agénticos y rendimiento de primer nivel. 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 56.6 SWE-bench Pro. Precios DashScope: $0.40 entrada / $2.40 salida por millón de tokens, aproximadamente 12x más barato que Claude Opus 4.6. Invocación por lotes al 50% de descuento. Hasta 65,536 tokens de salida por solicitud.

Ventana de contexto de 1M, parámetro preserve_thinking, 65K tokens de salida, lotes al 50% de descuento

Acceso por API vía DashScope y OpenRouter (nivel de vista previa gratuito disponible)

Qwen 3.6 Max

Propietario

Modelo propietario de alto rendimiento optimizado para razonamiento complejo, tareas multimodales y comprensión de documentos. Fuerte en matemáticas, ciencias, análisis visual y procesamiento de documentos extensos. Ventana de contexto extendida con capacidades de razonamiento avanzado para las tareas analíticas más exigentes.

Contexto extendido, capacidades multimodales, razonamiento avanzado, comprensión de documentos

Acceso por API vía DashScope y OpenRouter

Qwen 3.6 27B

Pesos abiertos

Modelo denso de 27B de parámetros que entrega el mejor rendimiento de programación de pesos abiertos. 77.2% SWE-bench Verified, 59.3 Terminal-Bench 2.0, 83.9 LiveCodeBench, 48.2 SkillsBench (supera a Claude 4.5 Opus con 45.3), 1487 QwenWebBench, 36.2 NL2Repo, 72.4 Claw-Eval. Puede correr con 16GB de VRAM usando IQ4_XS GGUF con compresión de caché KV soportando 100K de contexto.

55.6GB FP16, 16GB VRAM con IQ4_XS + compresión de caché KV, arquitectura densa, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), descargas GGUF

Qwen 3.6 35B A3B

Pesos abiertos

Modelo MoE con 35B total / 3B de parámetros activos. Rendimiento cercano al 27B en un formato para GPU de consumo. 73.4% SWE-bench Verified, 51.5 Terminal-Bench 2.0, 80.4 LiveCodeBench, 68.7 Claw-Eval, 1397 QwenWebBench. Corre en Mac M4 16GB con cuantización Q3 (~17GB). 20-40 tok/s en hardware de consumo a 4 bits. Visión y multimodal soportados.

~21GB Q4_K_M, ~17GB Q3_K_M (Mac M4 16GB), 3B parámetros activos, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), descargas GGUF

Ecosistema Qwen

Una familia de modelos unificada para cada escenario de despliegue y presupuesto

Desde API en la nube a $0.40/M de tokens hasta despliegue en laptop Mac M4, la familia Qwen 3.6 proporciona calidad consistente, interfaces compatibles y relación precio-rendimiento líder en la industria en todos los destinos de despliegue.

Qwen 3.6 Plus

78.8% SWE-bench, 1M de contexto, $0.40/M de tokens

Probar Plus

Qwen 3.6 Max

Razonamiento avanzado y multimodal

Probar Max

Qwen 3.6 27B

77.2% SWE-bench, supera a Claude en SkillsBench

Probar 27B

Qwen 3.6 35B A3B

73.4% SWE-bench, amigable con Mac M4 16GB

Probar 35B

Referencia de API

Endpoints compatibles con OpenAI, preserve_thinking

Ver API

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirse

Primeros pasos

¿Listo para explorar la familia Qwen 3.6? Prueba gratis, despliega donde quieras

Prueba cualquier modelo Qwen 3.6 gratis en el navegador o vía el nivel gratuito de OpenRouter. Descarga modelos de pesos abiertos bajo Apache 2.0 para ejecutar en tu propio hardware. Desde Mac M4 16GB hasta servidores de producción, desde API a $0.40/M de tokens hasta despliegue local sin costo.