Qwen 3.6 27B

27 mil millones de parámetros, arquitectura densa: supera a su predecesor MoE de 397B

Qwen 3.6 27B es un modelo denso construido sobre la arquitectura Hybrid Gated DeltaNet con 64 capas y contexto nativo de 262K. Obtiene un 77,2% en SWE-bench Verified, superando al MoE Qwen 3 de 397B con un 76,2%, y cabe en ~55,6 GB de VRAM en FP16 o ~18 GB con cuantización.

Variantes del modelo

Arquitectura densa, máxima calidad por parámetro

Qwen 3.6 27B ofrece rendimiento de frontera en un formato denso de 27B. Elige la variante ajustada para instrucciones para chat y tareas agénticas, o el modelo base para fine-tuning.

Arquitectura Hybrid Gated DeltaNet

27B parámetros densos, 64 capas, dimensión oculta 5120

Qwen 3.6 27B usa un diseño Hybrid Gated DeltaNet que combina la eficiencia de atención lineal con recurrencia con compuertas. La ventana de contexto nativa de 262K es extensible a 1M de tokens, ideal para análisis de documentos largos y flujos de trabajo agénticos complejos.

Con requisitos de VRAM de ~55,6 GB en FP16 o ~18 GB cuantizado, este modelo funciona en una sola GPU de gama alta o dos GPUs de consumo con el formato qwen 3.6 27b gguf.

Ajustado para instrucciones

27B Instruct

Optimizado para IA conversacional, programación y tareas agénticas complejas

Ajustado para seguimiento de instrucciones, diálogo multi-turno y uso de herramientas a través de la qwen 3.6 27b api

Disponible ahora

Pre-entrenado

27B Base

Modelo denso base para fine-tuning y aplicaciones especializadas

Pre-entrenado con datos diversos y arquitectura Hybrid Gated DeltaNet para máxima calidad

Disponible ahora

Capacidades

Una potencia densa que rinde muy por encima de su categoría

Qwen 3.6 27B combina la arquitectura Hybrid Gated DeltaNet con contexto de 262K para ofrecer un rendimiento que supera a modelos 14 veces más grandes en benchmarks de programación del mundo real.

Ingeniería de software de élite

77,2% en SWE-bench Verified, superando al MoE Qwen 3 de 397B (76,2%). Los resultados de benchmark de qwen 3.6 27b demuestran que las arquitecturas densas pueden igualar a modelos de escala frontera en programación real.

Dominio del terminal

59,3 en Terminal-Bench 2.0, igualando a Claude 4.5 Opus. Maneja flujos de trabajo complejos de terminal con múltiples pasos, sesiones de depuración y tareas de administración de sistemas con competencia de nivel experto.

Razonamiento avanzado

94,1% en AIME 2026 en matemáticas y 86,2 en MMLU-Pro en razonamiento de conocimiento. El modo de pensamiento paso a paso permite la resolución transparente de problemas en matemáticas, lógica y ciencia.

Contexto de 262K a 1M

Ventana de contexto nativa de 262K extensible a 1M de tokens. Procesa bases de código completas, artículos de investigación largos y conversaciones multi-turno sin perder coherencia.

Programación competitiva

83,9 en LiveCodeBench v6 para programación competitiva. Destaca en resolución de problemas algorítmicos, generación de código y tareas complejas de depuración.

Ejecución práctica de habilidades

48,2 en SkillsBench, superando a Claude 4.5 Opus (45,3). Demuestra una capacidad superior para seguir instrucciones complejas y ejecutar tareas del mundo real con múltiples pasos.

Aspectos destacados

Resultados excepcionales en benchmarks de qwen 3.6 27b

Qwen 3.6 27B logra resultados de clase frontera en programación, razonamiento y benchmarks agénticos manteniendo una inferencia densa eficiente.

Logros principales

  • SWE-bench Verified: 77,2% - supera al predecesor MoE de 397B (76,2%)
  • Terminal-Bench 2.0: 59,3 - iguala a Claude 4.5 Opus
  • SkillsBench: 48,2 - supera a Claude 4.5 Opus (45,3)
  • AIME 2026: 94,1% en matemáticas
  • LiveCodeBench v6: 83,9 en programación competitiva

Especificaciones técnicas

  • 27B parámetros densos, 64 capas, dimensión oculta 5120
  • Arquitectura Hybrid Gated DeltaNet
  • Contexto nativo de 262K, extensible a 1M de tokens
  • qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB cuantizado
  • Disponible en formato qwen 3.6 27b gguf para despliegue local

Rendimiento

Un modelo denso de 27B que supera al MoE de 397B en programación real

Qwen 3.6 27B obtiene un 77,2% en SWE-bench Verified y un 94,1% en AIME 2026, demostrando que un modelo denso bien diseñado puede igualar o superar a modelos muchas veces más grandes.

La suite de benchmarks de qwen 3.6 27b demuestra una excelencia consistente en ingeniería de software, operaciones de terminal, matemáticas y programación competitiva, rivalizando o superando a modelos con más de 10 veces más parámetros.

Gráfico comparativo de rendimiento de Qwen 3.6 27B en benchmarks de programación y razonamiento

SWE-bench Verified: 77,2% - supera al MoE Qwen 3 de 397B (76,2%)

Terminal-Bench 2.0: 59,3 - iguala a Claude 4.5 Opus

SkillsBench: 48,2 - supera a Claude 4.5 Opus con 45,3

AIME 2026: 94,1% en matemáticas avanzadas

MMLU-Pro: 86,2 en diversos dominios de conocimiento

Comparación de benchmarks

Qwen 3.6 27B vs modelos de frontera

Qwen 3.6 27B ofrece rendimiento de clase frontera en ingeniería de software, operaciones de terminal, razonamiento y benchmarks de programación. Accede a los resultados a través de la qwen 3.6 27b api.

Benchmark
Qwen 3.6 27B
Denso
Destacado
Qwen 3 235B A22B
MoE
Claude 4.5 Opus
Propietario
Qwen 3.6 35B A3B
MoE
SWE-bench Verified
Ingeniería de software real
77.2%76.2%-73.4%
Terminal-Bench 2.0
Operaciones de terminal
59.3-59.351.5
SkillsBench
Ejecución de tareas reales
48.2-45.3-
AIME 2026
Matemáticas
No tools
94.1%--92.7%
LiveCodeBench v6
Programación competitiva
83.9--80.4
MMLU-Pro
Conocimiento y razonamiento
86.2---

Resultados de benchmarks de la ficha oficial del modelo Qwen 3.6 y evaluaciones de HuggingFace.

Hybrid Gated DeltaNet

Una nueva arquitectura que redefine la eficiencia de los modelos densos

La arquitectura Hybrid Gated DeltaNet combina atención lineal con recurrencia con compuertas a lo largo de 64 capas y una dimensión oculta de 5120. Este diseño permite un contexto nativo de 262K extensible a 1M de tokens manteniendo la simplicidad de inferencia de un modelo denso.

  • 64 capas con dimensión oculta 5120 para aprendizaje profundo de representaciones
  • Ventana de contexto nativa de 262K, extensible a 1M de tokens
  • qwen 3.6 27b vram: ~55,6 GB FP16, ~18 GB con cuantización (qwen 3.6 27b gguf)
Una nueva arquitectura que redefine la eficiencia de los modelos densos

Ingeniería de software

77,2% en SWE-bench Verified: el modelo denso que superó a un MoE de 397B

Qwen 3.6 27B logra un 77,2% en SWE-bench Verified, superando a su predecesor MoE de 397B con un 76,2%. Combinado con 59,3 en Terminal-Bench 2.0 (igualando a Claude 4.5 Opus) y 83,9 en LiveCodeBench v6, es un asistente completo de ingeniería de software accesible a través de la qwen 3.6 27b api.

  • 77,2% en SWE-bench Verified - resolución de issues reales de GitHub
  • 59,3 en Terminal-Bench 2.0 - operaciones de terminal de nivel experto
  • 83,9 en LiveCodeBench v6 - excelencia en programación competitiva
77,2% en SWE-bench Verified: el modelo denso que superó a un MoE de 397B

Ecosistema Qwen

Parte de la familia de modelos Qwen 3.6

Qwen 3.6 27B forma parte de la última familia de modelos de Alibaba, con variantes densas y MoE, amplio soporte de la comunidad y compatibilidad con múltiples frameworks.

Documentación

Guías completas para integración y despliegue

Leer docs

HuggingFace

Descarga pesos y explora el hub de modelos

Descargar

Ficha del modelo

Especificaciones técnicas y resultados de evaluación

Ver detalles

Repositorio en GitHub

Código fuente, ejemplos y contribuciones de la comunidad

Ver código

Acceso a la API

Endpoints qwen 3.6 27b api compatibles con OpenAI

Empezar

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirse

Empezar

¿Listo para construir con Qwen 3.6 27B?

Empieza a chatear gratis al instante, o descarga los pesos de qwen3.6-27b para despliegue autoalojado en tu infraestructura.