Qwen 3.6 vs DeepSeek V4
DeepSeek V4가 등장한 가운데, Qwen 3.6 Plus가 검증된 결과로 에이전트 벤치마크를 선도합니다
~1T 파라미터 MoE 아키텍처와 1M 컨텍스트 윈도우를 갖춘 DeepSeek V4는 AI 분야의 강력한 새 경쟁자입니다. 하지만 Qwen 3.6 Plus는 이미 검증된 벤치마크로 앞서고 있습니다: 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 에이전트 워크플로를 위한 preserve_thinking 파라미터. $0.40/$2.40/M 토큰(Claude Opus 4.6 대비 약 12배 저렴)으로 Qwen 3.6은 최고의 가성비를 제공합니다. DeepSeek V4 Pro는 1.6T 파라미터로 확장됩니다. Qwen은 로컬 배포를 위한 오픈 웨이트 모델(27B 77.2% SWE-bench, 35B A3B)도 제공합니다.
벤치마크
Qwen 3.6 vs DeepSeek V4 - 이용 가능한 벤치마크 데이터 및 사양
현재 이용 가능한 데이터 기반 벤치마크 비교입니다. Qwen 3.6 Plus는 SWE-bench, Terminal-Bench, SkillsBench, 도구 사용 평가에서 검증된 결과로 에이전트 코딩 벤치마크를 선도합니다. DeepSeek V4 데이터는 더 많은 결과가 공개되면 업데이트됩니다.
Qwen 3.6 Plus는 소프트웨어 엔지니어링 및 에이전트 코딩 작업 전반에서 강력한 벤치마크 위치를 확립했으며, 27B 오픈 웨이트 모델은 Plus에 근접한 성능을 제공합니다. DeepSeek V4가 출시를 완료하면 더 종합적인 비교가 가능해질 것입니다. 현재 데이터는 Qwen 3.6이 검증되고 재현 가능한 결과와 성숙한 배포 생태계로 주요 에이전트 벤치마크를 선도하고 있음을 보여줍니다.


Qwen 3.6 Plus: 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0
Qwen 3.6 27B: 77.2% SWE-bench, 48.2 SkillsBench (Claude 4.5 Opus 상회)
Qwen 3.6 27B: 83.9 LiveCodeBench, 1487 QwenWebBench, 72.4 Claw-Eval
두 모델 모두: 1M 토큰 컨텍스트 윈도우
Qwen 3.6 Plus: $0.40/$2.40/M 토큰, 배치 50% 할인
벤치마크 표
Qwen 3.6 vs DeepSeek V4 - 현재 결과 및 사양
두 모델 패밀리의 이용 가능한 벤치마크 데이터입니다. DeepSeek V4 결과는 더 많은 데이터가 공개되면 업데이트됩니다. Qwen 3.6 결과는 재현 가능한 평가를 통한 공식 릴리스 기준입니다.
| Benchmark | Qwen 3.6 Plus 독점 지금 이용 가능 | Qwen 3.6 27B Dense 오픈 웨이트 | Qwen 3.6 35B A3B MoE 오픈 웨이트 | DeepSeek V4 ~1T MoE | DeepSeek V4 Pro 1.6T MoE |
|---|---|---|---|---|---|
SWE-bench Verified 실제 소프트웨어 엔지니어링 | 78.8% | 77.2% | 73.4% | - | - |
Terminal-Bench 2.0 터미널 작업 | 61.6 | 59.3 | 51.5 | - | - |
SkillsBench 실무 코딩 역량 | - | 48.2 | - | - | - |
LiveCodeBench 경쟁적 코드 생성 | - | 83.9 | 80.4 | - | - |
Claw-Eval Avg 엔드투엔드 에이전트 코딩 | - | 72.4 | 68.7 | - | - |
Context window 최대 컨텍스트 길이 | 1M 토큰 | 128K 토큰 | 128K 토큰 | 1M 토큰 | 1M 토큰 |
Architecture 모델 아키텍처 | 독점 | 27B Dense | 35B MoE (3B 활성) | ~1T MoE | 1.6T MoE |
preserve_thinking 에이전트 추론 상태 유지 | Yes | No | No | No | No |
Open-weight 로컬 배포 가능 | No | Yes (Apache 2.0) | Yes (Apache 2.0) | TBD | TBD |
Qwen 3.6 데이터 출처: 공식 릴리스(2026년 3월). DeepSeek V4 데이터 출처: 초기 출시 보고서(2026년 4월). 일부 DeepSeek V4 벤치마크는 전체 공개 대기 중.
Qwen 생태계
검증된 에이전트 성능, 지금 바로 이용 가능, 업계 최고의 가격
Qwen 3.6은 검증된 벤치마크, Apache 2.0 라이선스의 오픈 웨이트 모델, 에이전트 워크플로를 위한 preserve_thinking, $0.40/$2.40/M 토큰 가격으로 완전히 이용 가능합니다. 벤치마크를 기다리지 마세요 - 지금 바로 시작하세요.