Qwen 3.6 모델

네 가지 모델, 하나의 패밀리 - Mac M4 16GB부터 $0.40/M 토큰의 프론티어 성능까지

Qwen 3.6 패밀리는 독점 호스팅 모델과 오픈 웨이트 릴리스를 아우릅니다. Plus는 1M 컨텍스트와 preserve_thinking으로 78.8% SWE-bench를 달성하며 $0.40/$2.40/M 토큰(Claude Opus 4.6 대비 12배 저렴)입니다. Max는 고급 추론과 멀티모달 작업을 처리합니다. 27B Dense 모델은 77.2% SWE-bench와 48.2 SkillsBench(Claude 4.5 Opus 상회)를 달성합니다. 35B A3B MoE는 Mac M4 16GB에서 Q3 양자화로 20-40 tok/s를 제공합니다. 모든 모델이 동일한 아키텍처 기반과 OpenAI 호환 API를 공유합니다.

모델 패밀리

활용 사례와 예산에 맞는 Qwen 3.6 모델을 선택하세요

노트북에서의 경량 로컬 배포부터 1M 컨텍스트의 최대 호스팅 성능까지, Qwen 3.6 패밀리는 모든 규모, 예산, 배포 시나리오를 커버합니다.

독점

최대 성능과 1M 컨텍스트의 호스팅 모델

Plus와 Max는 API를 통해 이용 가능한 독점 모델입니다. 최고 성능, 1M 컨텍스트 윈도우, 최대 65,536 출력 토큰, 호스팅 티어 전용 preserve_thinking 등의 기능을 제공합니다. DashScope 가격은 입력 $0.40/M 토큰부터 시작하며, Claude Opus 4.6 대비 약 12배 저렴합니다. 배치 호출은 실시간 가격의 50%로 이용 가능합니다.

DashScope 및 OpenRouter(무료 티어 이용 가능)를 통한 OpenAI 호환 API로 이용 가능

오픈 웨이트

자체 하드웨어에서 완전한 제어로 실행 - Apache 2.0 라이선스

27B Dense와 35B A3B MoE 모델은 Apache 2.0 라이선스로 공개되어 있습니다. Ollama, vLLM, llama.cpp, SGLang 또는 KTransformers로 로컬 배포하세요. 27B는 IQ4_XS GGUF와 KV 캐시 압축으로 16GB VRAM에 적합합니다. 35B A3B는 Mac M4 16GB에서 Q3 양자화로 실행됩니다. 토큰당 비용 제로, 완전한 데이터 프라이버시, 파인튜닝 자유.

HuggingFace, Ollama, GGUF 저장소에서 이용 가능

Qwen 3.6 Plus

독점

1M 컨텍스트, 에이전트 워크플로를 위한 preserve_thinking, 최상위 성능을 갖춘 플래그십 독점 모델. 78.8% SWE-bench Verified, 61.6 Terminal-Bench 2.0, 56.6 SWE-bench Pro. DashScope 가격: 입력 $0.40 / 출력 $2.40/M 토큰, Claude Opus 4.6 대비 약 12배 저렴. 배치 호출 50% 할인. 요청당 최대 65,536 출력 토큰.

1M 컨텍스트 윈도우, preserve_thinking 파라미터, 65K 출력 토큰, 배치 50% 할인

DashScope 및 OpenRouter(무료 프리뷰 티어 이용 가능)를 통한 API 접근

Qwen 3.6 Max

독점

복잡한 추론, 멀티모달 작업, 문서 이해에 최적화된 고성능 독점 모델. 수학, 과학, 시각 분석, 장문 문서 처리 전반에서 강력합니다. 가장 까다로운 분석 작업을 위한 확장된 컨텍스트 윈도우와 고급 추론 역량.

확장된 컨텍스트, 멀티모달 역량, 고급 추론, 문서 이해

DashScope 및 OpenRouter를 통한 API 접근

Qwen 3.6 27B

오픈 웨이트

최고의 오픈 웨이트 코딩 성능을 제공하는 Dense 27B 파라미터 모델. 77.2% SWE-bench Verified, 59.3 Terminal-Bench 2.0, 83.9 LiveCodeBench, 48.2 SkillsBench(Claude 4.5 Opus 45.3 상회), 1487 QwenWebBench, 36.2 NL2Repo, 72.4 Claw-Eval. IQ4_XS GGUF와 KV 캐시 압축으로 100K 컨텍스트 지원하며 16GB VRAM에서 실행 가능.

55.6GB FP16, IQ4_XS + KV 캐시 압축으로 16GB VRAM, Dense 아키텍처, Apache 2.0

HuggingFace, Ollama (qwen3.6:27b), GGUF 다운로드

Qwen 3.6 35B A3B

오픈 웨이트

총 35B / 활성 3B 파라미터의 MoE 모델. 소비자 GPU 수준에서 27B에 근접한 성능. 73.4% SWE-bench Verified, 51.5 Terminal-Bench 2.0, 80.4 LiveCodeBench, 68.7 Claw-Eval, 1397 QwenWebBench. Mac M4 16GB에서 Q3 양자화(~17GB)로 실행. 4비트에서 소비자 하드웨어로 20-40 tok/s. 비전 및 멀티모달 지원.

Q4_K_M ~21GB, Q3_K_M ~17GB (Mac M4 16GB), 3B 활성 파라미터, 20-40 tok/s, Apache 2.0

HuggingFace, Ollama (qwen3.6:35b-a3b), GGUF 다운로드

Qwen 생태계

모든 배포 시나리오와 예산을 위한 통합 모델 패밀리

$0.40/M 토큰의 클라우드 API부터 Mac M4 노트북 배포까지, Qwen 3.6 패밀리는 모든 배포 대상에서 일관된 품질, 호환 인터페이스, 업계 최고의 가성비를 제공합니다.

Qwen 3.6 Plus

78.8% SWE-bench, 1M 컨텍스트, $0.40/M 토큰

Plus 체험하기

Qwen 3.6 Max

고급 추론 및 멀티모달

Max 체험하기

Qwen 3.6 27B

77.2% SWE-bench, SkillsBench에서 Claude 상회

27B 체험하기

Qwen 3.6 35B A3B

73.4% SWE-bench, Mac M4 16GB 지원

35B 체험하기

API 레퍼런스

OpenAI 호환 엔드포인트, preserve_thinking

API 보기

커뮤니티

Qwen 개발자 커뮤니티 참여

참여하기

시작하기

Qwen 3.6 패밀리를 탐색할 준비가 되셨나요? 무료로 체험하고 어디서든 배포하세요

브라우저에서 또는 OpenRouter 무료 티어를 통해 모든 Qwen 3.6 모델을 무료로 체험하세요. Apache 2.0 라이선스의 오픈 웨이트 모델을 다운로드하여 자체 하드웨어에서 실행하세요. Mac M4 16GB부터 프로덕션 서버까지, $0.40/M 토큰 API부터 비용 제로 로컬 배포까지.