Qwen Code

Programación agéntica que resuelve issues reales de GitHub, domina flujos de terminal y supera a Claude en SkillsBench

La familia Qwen 3.6 ofrece un rendimiento de élite en programación en todas las dimensiones. El modelo Plus alcanza un 78,8% en SWE-bench Verified y 61,6 en Terminal-Bench 2.0. El modelo denso 27B logra un 77,2% en SWE-bench, 48,2 en SkillsBench (superando a Claude 4.5 Opus con 45,3) y 1487 en QwenWebBench para generación de código frontend. El 35B A3B MoE aporta un 73,4% en SWE-bench con un consumo de GPU de consumo. Todos los modelos funcionan con Claude Code, OpenClaw, Aider y Continue.dev a través de la API compatible con OpenAI. preserve_thinking mantiene el estado de razonamiento entre iteraciones del bucle de agentes para desarrollo iterativo.

Empezar a programar Ver benchmarks

Capacidades de programación

Programación full-stack del terminal a producción, con preservación del razonamiento

Los modelos Qwen 3.6 destacan en cada etapa del ciclo de vida del desarrollo de software. Desde la comprensión de grandes bases de código y la generación de código hasta la depuración, las pruebas y el despliegue a través de flujos de trabajo de terminal. El parámetro preserve_thinking mantiene el contexto de razonamiento a lo largo de los ciclos de desarrollo iterativo.

Programación agéntica (SWE-bench)

Resuelve de forma autónoma issues reales de GitHub de principio a fin. Un 78,8% en SWE-bench Verified (Plus) y un 77,2% (27B) demuestran la capacidad de navegar repositorios, identificar causas raíz, implementar correcciones y enviar parches funcionales sin intervención humana. El 35B A3B alcanza un 73,4% con un consumo de GPU de consumo. Estas puntuaciones sitúan a Qwen 3.6 entre los mejores modelos para ingeniería de software autónoma.

Generación de código frontend (QwenWebBench)

El modelo 27B puntúa 1487 en QwenWebBench y el 35B A3B puntúa 1397, demostrando sólidas capacidades de generación de código frontend. Genera componentes completos de React, Vue y Next.js con tipado TypeScript correcto, atributos de accesibilidad, diseños responsivos e integración con sistemas de diseño. Maneja CSS-in-JS, Tailwind CSS y patrones de librerías de componentes. El parámetro preserve_thinking ayuda a mantener el contexto de diseño en la generación de múltiples archivos frontend.

Operaciones de terminal (Terminal-Bench)

61,6 en Terminal-Bench 2.0 (Plus) y 59,3 (27B): dominio experto del terminal. Gestiona flujos de trabajo complejos de shell de varios pasos, tareas de administración de sistemas, sesiones de depuración, gestión de pipelines CI/CD, orquestación de Docker y automatización de infraestructura. El 35B A3B puntúa 51,5, aún sólido para un modelo de GPU de consumo.

SkillsBench - supera a Claude 4.5 Opus

El modelo 27B puntúa 48,2 en SkillsBench, superando a Claude 4.5 Opus con 45,3. SkillsBench evalúa habilidades prácticas de programación incluyendo revisión de código, refactorización, diseño de APIs, estrategia de pruebas y toma de decisiones arquitectónicas. Este benchmark mide el tipo de criterio ingenieril matizado que importa en el desarrollo real, no solo la generación de código.

Razonamiento a nivel de repositorio (NL2Repo)

El modelo 27B puntúa 36,2 en NL2Repo, demostrando la capacidad de traducir descripciones en lenguaje natural a estructuras completas de repositorio. Comprende dependencias entre archivos, límites de módulos, patrones arquitectónicos y convenciones de proyecto a lo largo de repositorios completos. La ventana de contexto de 1M (Plus) permite procesar bases de código completas en una sola pasada para una comprensión integral.

Generación de código (LiveCodeBench)

83,9 en LiveCodeBench (27B) y 80,4 (35B A3B) para generación de código de nivel competitivo. Produce código limpio e idiomático en Python, TypeScript, Rust, Go, Java, C++ y más de 20 lenguajes con manejo adecuado de errores, documentación y cobertura de pruebas. Resuelve problemas algorítmicos, implementaciones de estructuras de datos y desafíos de diseño de sistemas.

Integración con herramientas de programación

Funciona con Claude Code, OpenClaw, Aider, Continue.dev y Qwen Code a través de la API compatible con OpenAI. Configura la URL base a tu endpoint de DashScope, OpenRouter u Ollama local y empieza a programar de inmediato. El parámetro preserve_thinking es especialmente valioso en los bucles de agentes de Claude Code y OpenClaw, donde mantener el estado de razonamiento entre iteraciones reduce el re-razonamiento redundante y mejora la precisión de las correcciones.

Depuración, pruebas y Claw-Eval

El modelo 27B puntúa 72,4 en la media de Claw-Eval y el 35B A3B puntúa 68,7, midiendo la capacidad de programación agéntica de extremo a extremo. Rastrea errores a través de pilas de llamadas complejas, identifica causas raíz a partir de registros de errores y genera suites de pruebas completas. Soporta pruebas unitarias, de integración, frameworks de pruebas de extremo a extremo y pruebas basadas en propiedades en todos los lenguajes y frameworks principales.

Benchmarks de programación

Resultados de primer nivel en todas las evaluaciones de programación

Los modelos Qwen 3.6 se posicionan consistentemente entre los mejores en ingeniería de software, generación de código, operaciones de terminal y benchmarks de habilidades prácticas de programación.

Benchmarks de ingeniería de software

SWE-bench Verified: 78,8% (Plus) / 77,2% (27B) / 73,4% (35B A3B)
Terminal-Bench 2.0: 61,6 (Plus) / 59,3 (27B) / 51,5 (35B A3B)
SkillsBench: 48,2 (27B) - supera a Claude 4.5 Opus (45,3)
Claw-Eval Media: 72,4 (27B) / 68,7 (35B A3B)
LiveCodeBench: 83,9 (27B) / 80,4 (35B A3B)
QwenWebBench: 1487 (27B) / 1397 (35B A3B) - generación frontend
NL2Repo: 36,2 (27B) - lenguaje natural a repositorio
SWE-bench Pro: 56,6 (Plus)

Herramientas y opciones de modelos

Compatible con: Claude Code, OpenClaw, Aider, Continue.dev, Qwen Code
27B Denso: mejor programación de pesos abiertos, 77,2% SWE-bench
35B A3B MoE: 73,4% SWE-bench en GPU de consumo (~21 GB de VRAM)
Plus: 78,8% SWE-bench, contexto de 1M, preserve_thinking
Frontend: React, Vue, Next.js con soporte TypeScript
preserve_thinking: mantiene el razonamiento entre iteraciones de agentes

Empezar a programar Comparar modelos

Primeros pasos

Empieza a programar con Qwen 3.6 - múltiples opciones disponibles

Elige el modelo y la herramienta adecuados para tu flujo de trabajo de programación. Desde chat en el navegador hasta despliegue local o integración por API.

Chatear con Qwen Code

Empieza a programar al instante con el mejor modelo Qwen 3.6 para tu tarea

Ejecutar en local con Ollama

Configuración con un comando: ollama run qwen3.6:35b-a3b para programación local

Acceso a la API

API compatible con OpenAI para integraciones con IDE y pipelines CI/CD

Comparación de modelos

Compara 27B, 35B A3B y Plus para tu caso de uso de programación

Configuración de Claude Code

Usa Qwen 3.6 como backend para Claude Code a través de la API

Integración con Continue.dev

Asistente de programación IA en VS Code con Qwen 3.6 local o por API

Guías de integración

Integra Qwen Code en tu flujo de trabajo de desarrollo

Conecta Qwen 3.6 a tus herramientas de desarrollo, IDEs y pipelines CI/CD favoritos para programación asistida por IA sin interrupciones.

Claude Code + Qwen

Configura Claude Code para usar Qwen 3.6 a través de la API compatible con OpenAI

Configuración de OpenClaw

Programación agéntica con OpenClaw y backend Qwen 3.6

Integración con Aider

Programación en pareja con IA usando Qwen 3.6 local o por API

Flujos de trabajo de terminal

Operaciones de terminal y generación de comandos potenciadas por IA

Flujos de trabajo Git

Revisiones de PR automatizadas, mensajes de commit y análisis de código

Scaffolding frontend

Generación de proyectos React, Vue, Next.js con TypeScript

Ecosistema Qwen

Modelos de programación para cada escala, desde GPU de consumo hasta rendimiento de frontera

Desde el 35B A3B que funciona en una sola GPU de consumo hasta el Plus con contexto de 1M y preserve_thinking, la familia Qwen 3.6 cubre todos los escenarios de despliegue para programación. Todos los modelos funcionan con Claude Code, OpenClaw, Aider y Continue.dev.

Explorar todos los modelos Documentación oficial

Qwen 3.6 27B

Denso, 77,2% SWE-bench, 48,2 SkillsBench

Más información

Qwen 3.6 35B A3B

MoE, 73,4% SWE-bench, GPU de consumo

Más información

Qwen 3.6 Plus

78,8% SWE-bench, contexto de 1M, preserve_thinking

Más información

Configuración de Ollama

Ejecuta Qwen Code en local con un solo comando

Empezar

Referencia de la API

Endpoints compatibles con OpenAI para tareas de programación

Ver API

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirse

Empieza a programar

¿Listo para programar con Qwen 3.6? 78,8% en SWE-bench, compatible con tus herramientas favoritas

Empieza a chatear gratis o integra a través de la API compatible con OpenAI. Compatible con Claude Code, OpenClaw, Aider y Continue.dev. Elige entre modelos de pesos abiertos que puedes ejecutar en local o el Plus para máximo rendimiento con preserve_thinking.

Empezar a programar Comparar modelos