Modelos Qwen 3.6

Cuatro modelos, una familia: desde Mac M4 16 GB hasta rendimiento de frontera a $0,40/M de tokens

La familia Qwen 3.6 abarca modelos propietarios alojados y publicaciones de pesos abiertos. Plus ofrece un 78,8% en SWE-bench con contexto de 1M y preserve_thinking a $0,40/$2,40 por millón de tokens (12 veces más barato que Claude Opus 4.6). Max gestiona razonamiento avanzado y tareas multimodales. El modelo denso 27B alcanza un 77,2% en SWE-bench y 48,2 en SkillsBench (superando a Claude 4.5 Opus). El 35B A3B MoE funciona en Mac M4 16 GB con cuantización Q3 a 20-40 tok/s. Todos los modelos comparten la misma base arquitectónica y API compatible con OpenAI.

Familia de modelos

Elige el modelo Qwen 3.6 adecuado para tu caso de uso y presupuesto

Desde despliegue local ligero en un portátil hasta máximo rendimiento alojado con contexto de 1M, la familia Qwen 3.6 cubre cada escala, presupuesto y escenario de despliegue.

Propietarios

Modelos alojados con máximo rendimiento y contexto de 1M

Plus y Max son modelos propietarios disponibles a través de API. Ofrecen el mayor rendimiento, ventanas de contexto de 1M, hasta 65.536 tokens de salida y funciones como preserve_thinking exclusivas del nivel alojado. Los precios de DashScope empiezan en $0,40 por millón de tokens de entrada, aproximadamente 12 veces más barato que Claude Opus 4.6. Invocación por lotes disponible al 50% del precio en tiempo real.

Disponibles a través de API compatible con OpenAI en DashScope y OpenRouter (nivel gratuito disponible)

Pesos abiertos

Ejecuta en tu propio hardware con control total, con licencia Apache 2.0

Los modelos denso 27B y 35B A3B MoE se publican con licencia Apache 2.0. Despliega en local con Ollama, vLLM, llama.cpp, SGLang o KTransformers. El 27B cabe en 16 GB de VRAM con IQ4_XS GGUF y compresión de caché KV. El 35B A3B funciona en Mac M4 16 GB con cuantización Q3. Sin coste por token, total privacidad de datos y libertad para ajustar.

Disponibles en HuggingFace, Ollama y repositorios GGUF

Qwen 3.6 Plus

Propietario

Modelo propietario insignia con contexto de 1M, preserve_thinking para flujos de trabajo agénticos y rendimiento de primer nivel. 78,8% en SWE-bench Verified, 61,6 en Terminal-Bench 2.0, 56,6 en SWE-bench Pro. Precios de DashScope: $0,40 entrada / $2,40 salida por millón de tokens, aproximadamente 12 veces más barato que Claude Opus 4.6. Invocación por lotes al 50% de descuento. Hasta 65.536 tokens de salida por solicitud.

Ventana de contexto de 1M, parámetro preserve_thinking, 65K tokens de salida, lotes al 50% de descuento

Acceso por API a través de DashScope y OpenRouter (nivel gratuito de vista previa disponible)

Qwen 3.6 Max

Propietario

Modelo propietario de alto rendimiento optimizado para razonamiento complejo, tareas multimodales y comprensión de documentos. Sólido en matemáticas, ciencias, análisis visual y procesamiento de documentos extensos. Ventana de contexto ampliada con capacidades de razonamiento avanzado para las tareas analíticas más exigentes.

Contexto ampliado, capacidades multimodales, razonamiento avanzado, comprensión de documentos

Acceso por API a través de DashScope y OpenRouter

Qwen 3.6 27B

Pesos abiertos

Modelo denso de 27B de parámetros que ofrece el mejor rendimiento de programación de pesos abiertos. 77,2% en SWE-bench Verified, 59,3 en Terminal-Bench 2.0, 83,9 en LiveCodeBench, 48,2 en SkillsBench (supera a Claude 4.5 Opus con 45,3), 1487 en QwenWebBench, 36,2 en NL2Repo, 72,4 en Claw-Eval. Puede funcionar con 16 GB de VRAM usando IQ4_XS GGUF con compresión de caché KV y soporte para contexto de 100K.

55,6 GB FP16, 16 GB de VRAM con IQ4_XS + compresión de caché KV, arquitectura densa, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), descargas GGUF

Qwen 3.6 35B A3B

Pesos abiertos

Modelo MoE con 35B en total / 3B de parámetros activos. Rendimiento cercano al 27B con un consumo de GPU de consumo. 73,4% en SWE-bench Verified, 51,5 en Terminal-Bench 2.0, 80,4 en LiveCodeBench, 68,7 en Claw-Eval, 1397 en QwenWebBench. Funciona en Mac M4 16 GB con cuantización Q3 (~17 GB). 20-40 tok/s en hardware de consumo en 4 bits. Visión y multimodal compatibles.

~21 GB Q4_K_M, ~17 GB Q3_K_M (Mac M4 16 GB), 3B parámetros activos, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), descargas GGUF

Ecosistema Qwen

Una familia de modelos unificada para cada escenario de despliegue y presupuesto

Desde API en la nube a $0,40/M de tokens hasta despliegue en portátil Mac M4, la familia Qwen 3.6 proporciona calidad consistente, interfaces compatibles y una relación precio-rendimiento líder en el sector en todos los destinos de despliegue.

Qwen 3.6 Plus

78,8% SWE-bench, contexto de 1M, $0,40/M de tokens

Probar Plus

Qwen 3.6 Max

Razonamiento avanzado y multimodal

Probar Max

Qwen 3.6 27B

77,2% SWE-bench, supera a Claude en SkillsBench

Probar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, compatible con Mac M4 16 GB

Probar 35B

Referencia de la API

Endpoints compatibles con OpenAI, preserve_thinking

Ver API

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirse

Primeros pasos

¿Listo para explorar la familia Qwen 3.6? Prueba gratis, despliega en cualquier lugar

Prueba cualquier modelo Qwen 3.6 gratis en el navegador o a través del nivel gratuito de OpenRouter. Descarga modelos de pesos abiertos con Apache 2.0 para ejecutar en tu propio hardware. Desde Mac M4 16 GB hasta servidores de producción, desde API a $0,40/M de tokens hasta despliegue local sin coste.