Modelos Qwen 3.6
Cuatro modelos, una familia: desde Mac M4 16 GB hasta rendimiento de frontera a $0,40/M de tokens
La familia Qwen 3.6 abarca modelos propietarios alojados y publicaciones de pesos abiertos. Plus ofrece un 78,8% en SWE-bench con contexto de 1M y preserve_thinking a $0,40/$2,40 por millón de tokens (12 veces más barato que Claude Opus 4.6). Max gestiona razonamiento avanzado y tareas multimodales. El modelo denso 27B alcanza un 77,2% en SWE-bench y 48,2 en SkillsBench (superando a Claude 4.5 Opus). El 35B A3B MoE funciona en Mac M4 16 GB con cuantización Q3 a 20-40 tok/s. Todos los modelos comparten la misma base arquitectónica y API compatible con OpenAI.
Familia de modelos
Elige el modelo Qwen 3.6 adecuado para tu caso de uso y presupuesto
Desde despliegue local ligero en un portátil hasta máximo rendimiento alojado con contexto de 1M, la familia Qwen 3.6 cubre cada escala, presupuesto y escenario de despliegue.
Propietarios
Modelos alojados con máximo rendimiento y contexto de 1M
Plus y Max son modelos propietarios disponibles a través de API. Ofrecen el mayor rendimiento, ventanas de contexto de 1M, hasta 65.536 tokens de salida y funciones como preserve_thinking exclusivas del nivel alojado. Los precios de DashScope empiezan en $0,40 por millón de tokens de entrada, aproximadamente 12 veces más barato que Claude Opus 4.6. Invocación por lotes disponible al 50% del precio en tiempo real.
Disponibles a través de API compatible con OpenAI en DashScope y OpenRouter (nivel gratuito disponible)
Pesos abiertos
Ejecuta en tu propio hardware con control total, con licencia Apache 2.0
Los modelos denso 27B y 35B A3B MoE se publican con licencia Apache 2.0. Despliega en local con Ollama, vLLM, llama.cpp, SGLang o KTransformers. El 27B cabe en 16 GB de VRAM con IQ4_XS GGUF y compresión de caché KV. El 35B A3B funciona en Mac M4 16 GB con cuantización Q3. Sin coste por token, total privacidad de datos y libertad para ajustar.
Disponibles en HuggingFace, Ollama y repositorios GGUF
Qwen 3.6 Plus
Propietario
Modelo propietario insignia con contexto de 1M, preserve_thinking para flujos de trabajo agénticos y rendimiento de primer nivel. 78,8% en SWE-bench Verified, 61,6 en Terminal-Bench 2.0, 56,6 en SWE-bench Pro. Precios de DashScope: $0,40 entrada / $2,40 salida por millón de tokens, aproximadamente 12 veces más barato que Claude Opus 4.6. Invocación por lotes al 50% de descuento. Hasta 65.536 tokens de salida por solicitud.
Ventana de contexto de 1M, parámetro preserve_thinking, 65K tokens de salida, lotes al 50% de descuento
Qwen 3.6 Max
Propietario
Modelo propietario de alto rendimiento optimizado para razonamiento complejo, tareas multimodales y comprensión de documentos. Sólido en matemáticas, ciencias, análisis visual y procesamiento de documentos extensos. Ventana de contexto ampliada con capacidades de razonamiento avanzado para las tareas analíticas más exigentes.
Contexto ampliado, capacidades multimodales, razonamiento avanzado, comprensión de documentos
Qwen 3.6 27B
Pesos abiertos
Modelo denso de 27B de parámetros que ofrece el mejor rendimiento de programación de pesos abiertos. 77,2% en SWE-bench Verified, 59,3 en Terminal-Bench 2.0, 83,9 en LiveCodeBench, 48,2 en SkillsBench (supera a Claude 4.5 Opus con 45,3), 1487 en QwenWebBench, 36,2 en NL2Repo, 72,4 en Claw-Eval. Puede funcionar con 16 GB de VRAM usando IQ4_XS GGUF con compresión de caché KV y soporte para contexto de 100K.
55,6 GB FP16, 16 GB de VRAM con IQ4_XS + compresión de caché KV, arquitectura densa, Apache 2.0
Qwen 3.6 35B A3B
Pesos abiertos
Modelo MoE con 35B en total / 3B de parámetros activos. Rendimiento cercano al 27B con un consumo de GPU de consumo. 73,4% en SWE-bench Verified, 51,5 en Terminal-Bench 2.0, 80,4 en LiveCodeBench, 68,7 en Claw-Eval, 1397 en QwenWebBench. Funciona en Mac M4 16 GB con cuantización Q3 (~17 GB). 20-40 tok/s en hardware de consumo en 4 bits. Visión y multimodal compatibles.
~21 GB Q4_K_M, ~17 GB Q3_K_M (Mac M4 16 GB), 3B parámetros activos, 20-40 tok/s, Apache 2.0
Ecosistema Qwen
Una familia de modelos unificada para cada escenario de despliegue y presupuesto
Desde API en la nube a $0,40/M de tokens hasta despliegue en portátil Mac M4, la familia Qwen 3.6 proporciona calidad consistente, interfaces compatibles y una relación precio-rendimiento líder en el sector en todos los destinos de despliegue.
Primeros pasos
¿Listo para explorar la familia Qwen 3.6? Prueba gratis, despliega en cualquier lugar
Prueba cualquier modelo Qwen 3.6 gratis en el navegador o a través del nivel gratuito de OpenRouter. Descarga modelos de pesos abiertos con Apache 2.0 para ejecutar en tu propio hardware. Desde Mac M4 16 GB hasta servidores de producción, desde API a $0,40/M de tokens hasta despliegue local sin coste.