Qwen 3.6 vs DeepSeek V4

Qwen 3.6 Plus lidera en benchmarks agénticos con resultados probados mientras DeepSeek V4 entra en escena

DeepSeek V4, con su arquitectura MoE de ~1T de parámetros y ventana de contexto de 1M, representa un nuevo competidor importante en el panorama de la IA. Pero Qwen 3.6 Plus ya lidera con benchmarks probados: 78,8% en SWE-bench Verified, 61,6 en Terminal-Bench 2.0 y el parámetro preserve_thinking para flujos de trabajo agénticos. A $0,40/$2,40 por millón de tokens (12 veces más barato que Claude Opus 4.6), Qwen 3.6 ofrece una relación precio-rendimiento inigualable. DeepSeek V4 Pro escala hasta 1,6T de parámetros. Qwen también proporciona modelos de pesos abiertos (27B con 77,2% en SWE-bench, 35B A3B) para despliegue local.

Benchmarks

Qwen 3.6 vs DeepSeek V4 - datos de benchmarks y especificaciones disponibles

Comparativa de benchmarks basada en datos actualmente disponibles. Qwen 3.6 Plus lidera en benchmarks de programación agéntica con resultados probados en SWE-bench, Terminal-Bench, SkillsBench y evaluaciones de uso de herramientas. Los datos de DeepSeek V4 se actualizarán a medida que se publiquen más resultados.

Qwen 3.6 Plus ha establecido posiciones sólidas en benchmarks de ingeniería de software y programación agéntica, con el modelo de pesos abiertos 27B ofreciendo un rendimiento cercano al Plus. A medida que DeepSeek V4 complete su despliegue, habrá comparativas más completas disponibles. Los datos actuales muestran a Qwen 3.6 liderando en los benchmarks agénticos clave con resultados probados y reproducibles y un ecosistema de despliegue maduro.

Gráfico comparativo de benchmarks mostrando el rendimiento de Qwen 3.6 vs DeepSeek V4 en benchmarks disponibles incluyendo SWE-bench, Terminal-Bench y SkillsBench

Qwen 3.6 Plus: 78,8% SWE-bench Verified, 61,6 Terminal-Bench 2.0

Qwen 3.6 27B: 77,2% SWE-bench, 48,2 SkillsBench (supera a Claude 4.5 Opus)

Qwen 3.6 27B: 83,9 LiveCodeBench, 1487 QwenWebBench, 72,4 Claw-Eval

Ambos modelos: ventana de contexto de 1M de tokens

Qwen 3.6 Plus: $0,40/$2,40 por M de tokens, lotes al 50% de descuento

Tabla de benchmarks

Qwen 3.6 vs DeepSeek V4 - resultados actuales y especificaciones

Datos de benchmarks disponibles para ambas familias de modelos. Los resultados de DeepSeek V4 se actualizarán a medida que se publiquen más datos. Los resultados de Qwen 3.6 provienen de publicaciones oficiales con evaluaciones reproducibles.

Benchmark
Qwen 3.6 Plus
Propietario
Disponible ahora
Qwen 3.6 27B
Denso pesos abiertos
Qwen 3.6 35B A3B
MoE pesos abiertos
DeepSeek V4
~1T MoE
DeepSeek V4 Pro
1.6T MoE
SWE-bench Verified
Ingeniería de software real
78.8%77.2%73.4%--
Terminal-Bench 2.0
Operaciones de terminal
61.659.351.5--
SkillsBench
Habilidades prácticas de programación
-48.2---
LiveCodeBench
Generación de código competitivo
-83.980.4--
Claw-Eval Avg
Programación agéntica de extremo a extremo
-72.468.7--
Context window
Longitud máxima de contexto
1M tokens128K tokens128K tokens1M tokens1M tokens
Architecture
Arquitectura del modelo
Proprietary27B Dense35B MoE (3B active)~1T MoE1.6T MoE
preserve_thinking
Persistencia de razonamiento agéntico
YesNoNoNoNo
Open-weight
Despliegue local disponible
NoYes (Apache 2.0)Yes (Apache 2.0)TBDTBD

Datos de Qwen 3.6 de la publicación oficial (marzo 2026). Datos de DeepSeek V4 de los informes de lanzamiento inicial (abril 2026). Algunos benchmarks de DeepSeek V4 pendientes de publicación completa.

Ecosistema Qwen

Rendimiento agéntico probado, disponible hoy, con precios líderes en el sector

Qwen 3.6 está completamente disponible con benchmarks probados, modelos de pesos abiertos con Apache 2.0, preserve_thinking para flujos de trabajo agénticos y precios de $0,40/$2,40 por millón de tokens. No esperes a los benchmarks: empieza a construir hoy.

Qwen 3.6 Plus

78,8% SWE-bench, $0,40/M de tokens

Probar Plus

Qwen 3.6 27B

77,2% SWE-bench, pesos abiertos, Apache 2.0

Probar 27B

Qwen 3.6 35B A3B

73,4% SWE-bench, GPU de consumo

Probar 35B

Acceso a la API

Compatible con OpenAI, preserve_thinking, nivel gratuito

Ver API

Ejecutar en local

Ollama, vLLM, llama.cpp, SGLang

Empezar

Comunidad

Únete a la comunidad de desarrolladores Qwen

Unirse

Probar Qwen 3.6

No esperes a los benchmarks: experimenta el rendimiento agéntico probado hoy

Qwen 3.6 está completamente disponible con 78,8% en SWE-bench, preserve_thinking y $0,40/$2,40 por millón de tokens. Chatea gratis, despliega en local con modelos de pesos abiertos o integra a través de la API compatible con OpenAI. Compatible con Claude Code, OpenClaw, Aider y Continue.dev.