Qwen 3.6 모델
네 가지 모델, 하나의 패밀리 - Mac M4 16GB부터 $0.40/M 토큰의 프론티어 성능까지
Qwen 3.6 패밀리는 독점 호스팅 모델과 오픈 웨이트 릴리스를 아우릅니다. Plus는 1M 컨텍스트와 preserve_thinking으로 78.8% SWE-bench를 달성하며 $0.40/$2.40/M 토큰(Claude Opus 4.6 대비 12배 저렴)입니다. Max는 고급 추론과 멀티모달 작업을 처리합니다. 27B Dense 모델은 77.2% SWE-bench와 48.2 SkillsBench(Claude 4.5 Opus 상회)를 달성합니다. 35B A3B MoE는 Mac M4 16GB에서 Q3 양자화로 20-40 tok/s를 제공합니다. 모든 모델이 동일한 아키텍처 기반과 OpenAI 호환 API를 공유합니다.
모델 패밀리
활용 사례와 예산에 맞는 Qwen 3.6 모델을 선택하세요
노트북에서의 경량 로컬 배포부터 1M 컨텍스트의 최대 호스팅 성능까지, Qwen 3.6 패밀리는 모든 규모, 예산, 배포 시나리오를 커버합니다.
독점
최대 성능과 1M 컨텍스트의 호스팅 모델
Plus와 Max는 API를 통해 이용 가능한 독점 모델입니다. 최고 성능, 1M 컨텍스트 윈도우, 최대 65,536 출력 토큰, 호스팅 티어 전용 preserve_thinking 등의 기능을 제공합니다. DashScope 가격은 입력 $0.40/M 토큰부터 시작하며, Claude Opus 4.6 대비 약 12배 저렴합니다. 배치 호출은 실시간 가격의 50%로 이용 가능합니다.
DashScope 및 OpenRouter(무료 티어 이용 가능)를 통한 OpenAI 호환 API로 이용 가능
오픈 웨이트
자체 하드웨어에서 완전한 제어로 실행 - Apache 2.0 라이선스
27B Dense와 35B A3B MoE 모델은 Apache 2.0 라이선스로 공개되어 있습니다. Ollama, vLLM, llama.cpp, SGLang 또는 KTransformers로 로컬 배포하세요. 27B는 IQ4_XS GGUF와 KV 캐시 압축으로 16GB VRAM에 적합합니다. 35B A3B는 Mac M4 16GB에서 Q3 양자화로 실행됩니다. 토큰당 비용 제로, 완전한 데이터 프라이버시, 파인튜닝 자유.
HuggingFace, Ollama, GGUF 저장소에서 이용 가능
Qwen 3.6 Plus
독점
1M 컨텍스트, 에이전트 워크플로를 위한 preserve_thinking, 최상위 성능을 갖춘 플래그십 독점 모델. 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 56.6 SWE-bench Pro. DashScope 가격: 입력 $0.40 / 출력 $2.40/M 토큰, Claude Opus 4.6 대비 약 12배 저렴. 배치 호출 50% 할인. 요청당 최대 65,536 출력 토큰.
1M 컨텍스트 윈도우, preserve_thinking 파라미터, 65K 출력 토큰, 배치 50% 할인
Qwen 3.6 Max
독점
복잡한 추론, 멀티모달 작업, 문서 이해에 최적화된 고성능 독점 모델. 수학, 과학, 시각 분석, 장문 문서 처리 전반에서 강력합니다. 가장 까다로운 분석 작업을 위한 확장된 컨텍스트 윈도우와 고급 추론 역량.
확장된 컨텍스트, 멀티모달 역량, 고급 추론, 문서 이해
Qwen 3.6 27B
오픈 웨이트
최고의 오픈 웨이트 코딩 성능을 제공하는 Dense 27B 파라미터 모델. 77.2% SWE-bench Verified, 59.3 Terminal-Bench 2.0, 83.9 LiveCodeBench, 48.2 SkillsBench(Claude 4.5 Opus 45.3 상회), 1487 QwenWebBench, 36.2 NL2Repo, 72.4 Claw-Eval. IQ4_XS GGUF와 KV 캐시 압축으로 100K 컨텍스트 지원하며 16GB VRAM에서 실행 가능.
55.6GB FP16, IQ4_XS + KV 캐시 압축으로 16GB VRAM, Dense 아키텍처, Apache 2.0
Qwen 3.6 35B A3B
오픈 웨이트
총 35B / 활성 3B 파라미터의 MoE 모델. 소비자 GPU 수준에서 27B에 근접한 성능. 73.4% SWE-bench Verified, 51.5 Terminal-Bench 2.0, 80.4 LiveCodeBench, 68.7 Claw-Eval, 1397 QwenWebBench. Mac M4 16GB에서 Q3 양자화(~17GB)로 실행. 4비트에서 소비자 하드웨어로 20-40 tok/s. 비전 및 멀티모달 지원.
Q4_K_M ~21GB, Q3_K_M ~17GB (Mac M4 16GB), 3B 활성 파라미터, 20-40 tok/s, Apache 2.0
Qwen 생태계
모든 배포 시나리오와 예산을 위한 통합 모델 패밀리
$0.40/M 토큰의 클라우드 API부터 Mac M4 노트북 배포까지, Qwen 3.6 패밀리는 모든 배포 대상에서 일관된 품질, 호환 인터페이스, 업계 최고의 가성비를 제공합니다.