Qwen Code
Programación agéntica que resuelve issues reales de GitHub, domina flujos de terminal y supera a Claude en SkillsBench
La familia Qwen 3.6 ofrece un rendimiento de élite en programación en todas las dimensiones. El modelo Plus alcanza un 78,8% en SWE-bench Verified y 61,6 en Terminal-Bench 2.0. El modelo denso 27B logra un 77,2% en SWE-bench, 48,2 en SkillsBench (superando a Claude 4.5 Opus con 45,3) y 1487 en QwenWebBench para generación de código frontend. El 35B A3B MoE aporta un 73,4% en SWE-bench con un consumo de GPU de consumo. Todos los modelos funcionan con Claude Code, OpenClaw, Aider y Continue.dev a través de la API compatible con OpenAI. preserve_thinking mantiene el estado de razonamiento entre iteraciones del bucle de agentes para desarrollo iterativo.
Capacidades de programación
Programación full-stack del terminal a producción, con preservación del razonamiento
Los modelos Qwen 3.6 destacan en cada etapa del ciclo de vida del desarrollo de software. Desde la comprensión de grandes bases de código y la generación de código hasta la depuración, las pruebas y el despliegue a través de flujos de trabajo de terminal. El parámetro preserve_thinking mantiene el contexto de razonamiento a lo largo de los ciclos de desarrollo iterativo.
Programación agéntica (SWE-bench)
Resuelve de forma autónoma issues reales de GitHub de principio a fin. Un 78,8% en SWE-bench Verified (Plus) y un 77,2% (27B) demuestran la capacidad de navegar repositorios, identificar causas raíz, implementar correcciones y enviar parches funcionales sin intervención humana. El 35B A3B alcanza un 73,4% con un consumo de GPU de consumo. Estas puntuaciones sitúan a Qwen 3.6 entre los mejores modelos para ingeniería de software autónoma.
Generación de código frontend (QwenWebBench)
El modelo 27B puntúa 1487 en QwenWebBench y el 35B A3B puntúa 1397, demostrando sólidas capacidades de generación de código frontend. Genera componentes completos de React, Vue y Next.js con tipado TypeScript correcto, atributos de accesibilidad, diseños responsivos e integración con sistemas de diseño. Maneja CSS-in-JS, Tailwind CSS y patrones de librerías de componentes. El parámetro preserve_thinking ayuda a mantener el contexto de diseño en la generación de múltiples archivos frontend.
Operaciones de terminal (Terminal-Bench)
61,6 en Terminal-Bench 2.0 (Plus) y 59,3 (27B): dominio experto del terminal. Gestiona flujos de trabajo complejos de shell de varios pasos, tareas de administración de sistemas, sesiones de depuración, gestión de pipelines CI/CD, orquestación de Docker y automatización de infraestructura. El 35B A3B puntúa 51,5, aún sólido para un modelo de GPU de consumo.
SkillsBench - supera a Claude 4.5 Opus
El modelo 27B puntúa 48,2 en SkillsBench, superando a Claude 4.5 Opus con 45,3. SkillsBench evalúa habilidades prácticas de programación incluyendo revisión de código, refactorización, diseño de APIs, estrategia de pruebas y toma de decisiones arquitectónicas. Este benchmark mide el tipo de criterio ingenieril matizado que importa en el desarrollo real, no solo la generación de código.
Razonamiento a nivel de repositorio (NL2Repo)
El modelo 27B puntúa 36,2 en NL2Repo, demostrando la capacidad de traducir descripciones en lenguaje natural a estructuras completas de repositorio. Comprende dependencias entre archivos, límites de módulos, patrones arquitectónicos y convenciones de proyecto a lo largo de repositorios completos. La ventana de contexto de 1M (Plus) permite procesar bases de código completas en una sola pasada para una comprensión integral.
Generación de código (LiveCodeBench)
83,9 en LiveCodeBench (27B) y 80,4 (35B A3B) para generación de código de nivel competitivo. Produce código limpio e idiomático en Python, TypeScript, Rust, Go, Java, C++ y más de 20 lenguajes con manejo adecuado de errores, documentación y cobertura de pruebas. Resuelve problemas algorítmicos, implementaciones de estructuras de datos y desafíos de diseño de sistemas.
Integración con herramientas de programación
Funciona con Claude Code, OpenClaw, Aider, Continue.dev y Qwen Code a través de la API compatible con OpenAI. Configura la URL base a tu endpoint de DashScope, OpenRouter u Ollama local y empieza a programar de inmediato. El parámetro preserve_thinking es especialmente valioso en los bucles de agentes de Claude Code y OpenClaw, donde mantener el estado de razonamiento entre iteraciones reduce el re-razonamiento redundante y mejora la precisión de las correcciones.
Depuración, pruebas y Claw-Eval
El modelo 27B puntúa 72,4 en la media de Claw-Eval y el 35B A3B puntúa 68,7, midiendo la capacidad de programación agéntica de extremo a extremo. Rastrea errores a través de pilas de llamadas complejas, identifica causas raíz a partir de registros de errores y genera suites de pruebas completas. Soporta pruebas unitarias, de integración, frameworks de pruebas de extremo a extremo y pruebas basadas en propiedades en todos los lenguajes y frameworks principales.
Benchmarks de programación
Resultados de primer nivel en todas las evaluaciones de programación
Los modelos Qwen 3.6 se posicionan consistentemente entre los mejores en ingeniería de software, generación de código, operaciones de terminal y benchmarks de habilidades prácticas de programación.
Benchmarks de ingeniería de software
- SWE-bench Verified: 78,8% (Plus) / 77,2% (27B) / 73,4% (35B A3B)
- Terminal-Bench 2.0: 61,6 (Plus) / 59,3 (27B) / 51,5 (35B A3B)
- SkillsBench: 48,2 (27B) - supera a Claude 4.5 Opus (45,3)
- Claw-Eval Media: 72,4 (27B) / 68,7 (35B A3B)
- LiveCodeBench: 83,9 (27B) / 80,4 (35B A3B)
- QwenWebBench: 1487 (27B) / 1397 (35B A3B) - generación frontend
- NL2Repo: 36,2 (27B) - lenguaje natural a repositorio
- SWE-bench Pro: 56,6 (Plus)
Herramientas y opciones de modelos
- Compatible con: Claude Code, OpenClaw, Aider, Continue.dev, Qwen Code
- 27B Denso: mejor programación de pesos abiertos, 77,2% SWE-bench
- 35B A3B MoE: 73,4% SWE-bench en GPU de consumo (~21 GB de VRAM)
- Plus: 78,8% SWE-bench, contexto de 1M, preserve_thinking
- Frontend: React, Vue, Next.js con soporte TypeScript
- preserve_thinking: mantiene el razonamiento entre iteraciones de agentes
Primeros pasos
Empieza a programar con Qwen 3.6 - múltiples opciones disponibles
Elige el modelo y la herramienta adecuados para tu flujo de trabajo de programación. Desde chat en el navegador hasta despliegue local o integración por API.
Empieza a programar al instante con el mejor modelo Qwen 3.6 para tu tarea
Configuración con un comando: ollama run qwen3.6:35b-a3b para programación local
API compatible con OpenAI para integraciones con IDE y pipelines CI/CD
Compara 27B, 35B A3B y Plus para tu caso de uso de programación
Usa Qwen 3.6 como backend para Claude Code a través de la API
Asistente de programación IA en VS Code con Qwen 3.6 local o por API
Guías de integración
Integra Qwen Code en tu flujo de trabajo de desarrollo
Conecta Qwen 3.6 a tus herramientas de desarrollo, IDEs y pipelines CI/CD favoritos para programación asistida por IA sin interrupciones.
Configura Claude Code para usar Qwen 3.6 a través de la API compatible con OpenAI
Programación agéntica con OpenClaw y backend Qwen 3.6
Programación en pareja con IA usando Qwen 3.6 local o por API
Operaciones de terminal y generación de comandos potenciadas por IA
Revisiones de PR automatizadas, mensajes de commit y análisis de código
Generación de proyectos React, Vue, Next.js con TypeScript
Ecosistema Qwen
Modelos de programación para cada escala, desde GPU de consumo hasta rendimiento de frontera
Desde el 35B A3B que funciona en una sola GPU de consumo hasta el Plus con contexto de 1M y preserve_thinking, la familia Qwen 3.6 cubre todos los escenarios de despliegue para programación. Todos los modelos funcionan con Claude Code, OpenClaw, Aider y Continue.dev.
Empieza a programar
¿Listo para programar con Qwen 3.6? 78,8% en SWE-bench, compatible con tus herramientas favoritas
Empieza a chatear gratis o integra a través de la API compatible con OpenAI. Compatible con Claude Code, OpenClaw, Aider y Continue.dev. Elige entre modelos de pesos abiertos que puedes ejecutar en local o el Plus para máximo rendimiento con preserve_thinking.