Qwen 3.6 27B

27 mil millones de parámetros, arquitectura densa - supera a su predecesor MoE de 397B

Qwen 3.6 27B es un modelo denso construido sobre la arquitectura Hybrid Gated DeltaNet con 64 capas y contexto nativo de 262K. Obtiene 77.2% en SWE-bench Verified, superando al Qwen 3 MoE de 397B con 76.2%, y cabe en ~55.6GB de VRAM en FP16 o ~18GB con cuantización.

Variantes del modelo

Arquitectura densa, máxima calidad por parámetro

Qwen 3.6 27B ofrece rendimiento de clase frontera en un formato denso de 27B. Elige la variante ajustada para instrucciones para chat y tareas agénticas, o el modelo base para fine-tuning.

Arquitectura Hybrid Gated DeltaNet

27B parámetros densos, 64 capas, dimensión oculta 5120

Qwen 3.6 27B usa un diseño Hybrid Gated DeltaNet que combina eficiencia de atención lineal con recurrencia controlada. La ventana de contexto nativa de 262K es extensible a 1M de tokens, haciéndolo ideal para análisis de documentos largos y flujos de trabajo agénticos complejos.

Con requisitos de VRAM de ~55.6GB en FP16 o ~18GB cuantizado, este modelo funciona en una sola GPU de gama alta o dos GPUs de consumo con el formato qwen 3.6 27b gguf.

Ajustado para instrucciones

27B Instruct

Optimizado para IA conversacional, programación y tareas agénticas complejas

Ajustado para seguimiento de instrucciones, diálogo multi-turno y uso de herramientas vía la API de qwen 3.6 27b

Disponible ahora

Pre-entrenado

27B Base

Modelo denso base para fine-tuning y aplicaciones especializadas

Pre-entrenado con datos diversos usando arquitectura Hybrid Gated DeltaNet para máxima calidad

Disponible ahora

Capacidades

Potencia densa que rinde por encima de su categoría

Qwen 3.6 27B combina la arquitectura Hybrid Gated DeltaNet con contexto de 262K para ofrecer un rendimiento que supera a modelos 14 veces más grandes en benchmarks de programación del mundo real.

Ingeniería de software de élite

77.2% en SWE-bench Verified - superando al Qwen 3 MoE de 397B (76.2%). Los resultados de benchmark de qwen 3.6 27b demuestran que las arquitecturas densas pueden igualar a modelos de escala frontera en programación real.

Dominio de terminal

59.3 en Terminal-Bench 2.0, igualando a Claude 4.5 Opus. Maneja flujos de trabajo complejos de terminal con múltiples pasos, sesiones de depuración y tareas de administración de sistemas con competencia de nivel experto.

Razonamiento avanzado

94.1% en AIME 2026 en matemáticas y 86.2 en MMLU-Pro en razonamiento de conocimiento. El modo de pensamiento paso a paso permite resolución transparente de problemas en matemáticas, lógica y ciencia.

Contexto de 262K a 1M

Ventana de contexto nativa de 262K extensible a 1M de tokens. Procesa bases de código completas, artículos de investigación largos y conversaciones multi-turno sin perder coherencia.

Programación competitiva

83.9 en LiveCodeBench v6 para programación competitiva. Sobresale en resolución de problemas algorítmicos, generación de código y tareas complejas de depuración.

Ejecución de habilidades prácticas

48.2 en SkillsBench, superando a Claude 4.5 Opus (45.3). Demuestra capacidad superior para seguir instrucciones complejas y ejecutar tareas del mundo real con múltiples pasos.

Puntos clave

Resultados excepcionales en benchmarks de qwen 3.6 27b

Qwen 3.6 27B logra resultados de clase frontera en benchmarks de programación, razonamiento y tareas agénticas manteniendo una inferencia densa eficiente.

Logros principales

  • SWE-bench Verified: 77.2% - supera al predecesor MoE de 397B (76.2%)
  • Terminal-Bench 2.0: 59.3 - iguala a Claude 4.5 Opus
  • SkillsBench: 48.2 - supera a Claude 4.5 Opus (45.3)
  • AIME 2026: 94.1% en matemáticas
  • LiveCodeBench v6: 83.9 en programación competitiva

Especificaciones técnicas

  • 27B parámetros densos, 64 capas, dimensión oculta 5120
  • Arquitectura Hybrid Gated DeltaNet
  • Contexto nativo de 262K, extensible a 1M de tokens
  • qwen 3.6 27b vram: ~55.6GB FP16, ~18GB cuantizado
  • Disponible en formato qwen 3.6 27b gguf para despliegue local

Rendimiento

Modelo denso de 27B que supera al MoE de 397B en programación real

Qwen 3.6 27B obtiene 77.2% en SWE-bench Verified y 94.1% en AIME 2026, demostrando que un modelo denso bien diseñado puede igualar o superar a modelos muchas veces más grandes.

La suite de benchmarks de qwen 3.6 27b demuestra excelencia consistente en ingeniería de software, operaciones de terminal, matemáticas y programación competitiva - rivalizando o superando a modelos con 10x+ más parámetros.

Gráfica comparativa de rendimiento de Qwen 3.6 27B en benchmarks de programación y razonamiento

SWE-bench Verified: 77.2% - supera al Qwen 3 MoE de 397B (76.2%)

Terminal-Bench 2.0: 59.3 - iguala a Claude 4.5 Opus

SkillsBench: 48.2 - supera a Claude 4.5 Opus con 45.3

AIME 2026: 94.1% en matemáticas avanzadas

MMLU-Pro: 86.2 en diversos dominios de conocimiento

Comparación de benchmarks

Qwen 3.6 27B vs modelos de frontera

Qwen 3.6 27B ofrece rendimiento de clase frontera en benchmarks de ingeniería de software, operaciones de terminal, razonamiento y programación. Accede a los resultados vía la API de qwen 3.6 27b.

Benchmark
Qwen 3.6 27B
Denso
Destacado
Qwen 3 235B A22B
MoE
Claude 4.5 Opus
Propietario
Qwen 3.6 35B A3B
MoE
SWE-bench Verified
Ingeniería de software real
77.2%76.2%-73.4%
Terminal-Bench 2.0
Operaciones de terminal
59.3-59.351.5
SkillsBench
Ejecución de tareas reales
48.2-45.3-
AIME 2026
Matemáticas
No tools
94.1%--92.7%
LiveCodeBench v6
Programación competitiva
83.9--80.4
MMLU-Pro
Conocimiento y razonamiento
86.2---

Resultados de benchmarks de la ficha oficial del modelo Qwen 3.6 y evaluaciones de HuggingFace.

Hybrid Gated DeltaNet

Una nueva arquitectura que redefine la eficiencia de modelos densos

La arquitectura Hybrid Gated DeltaNet combina atención lineal con recurrencia controlada a través de 64 capas y una dimensión oculta de 5120. Este diseño permite un contexto nativo de 262K extensible a 1M de tokens manteniendo la simplicidad de inferencia de un modelo denso.

  • 64 capas con dimensión oculta 5120 para aprendizaje profundo de representaciones
  • Ventana de contexto nativa de 262K, extensible a 1M de tokens
  • qwen 3.6 27b vram: ~55.6GB FP16, ~18GB con cuantización (qwen 3.6 27b gguf)
Una nueva arquitectura que redefine la eficiencia de modelos densos

Ingeniería de Software

77.2% en SWE-bench Verified - el modelo denso que superó a un MoE de 397B

Qwen 3.6 27B logra 77.2% en SWE-bench Verified, superando a su predecesor MoE de 397B con 76.2%. Combinado con 59.3 en Terminal-Bench 2.0 (igualando a Claude 4.5 Opus) y 83.9 en LiveCodeBench v6, es un asistente completo de ingeniería de software accesible a través de la API de qwen 3.6 27b.

  • 77.2% en SWE-bench Verified - resolución de issues reales de GitHub
  • 59.3 en Terminal-Bench 2.0 - operaciones de terminal de nivel experto
  • 83.9 en LiveCodeBench v6 - excelencia en programación competitiva
77.2% en SWE-bench Verified - el modelo denso que superó a un MoE de 397B

Ecosistema Qwen

Parte de la familia de modelos Qwen 3.6

Qwen 3.6 27B es parte de la última familia de modelos de Alibaba, con variantes densas y MoE, amplio soporte comunitario y compatibilidad con múltiples frameworks.

Documentación

Guías completas para integración y despliegue

Leer docs

HuggingFace

Descarga pesos y explora el hub de modelos

Descargar

Ficha del Modelo

Especificaciones técnicas y resultados de evaluación

Ver detalles

Repositorio en GitHub

Código fuente, ejemplos y contribuciones de la comunidad

Ver código

Acceso a la API

Endpoints de API qwen 3.6 27b compatibles con OpenAI

Comenzar

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirte

Comenzar

¿Listo para construir con Qwen 3.6 27B?

Comienza a chatear gratis al instante, o descarga los pesos de qwen3.6-27b para despliegue propio en tu infraestructura.