Qwen 3.6 مقابل Gemma 4

Qwen 3.6 يتفوق على Gemma 4 في البرمجة والطرفية والرياضيات ومعايير الواجهات الأمامية

مقارنة مباشرة بين عائلتي نماذج Qwen 3.6 وGoogle Gemma 4. يتفوق Qwen 3.6 35B A3B على Gemma 4 26B A4B في SWE-bench Verified (73.4% مقابل 52.0%)، وTerminal-Bench 2.0 (51.5 مقابل 42.9)، وAIME 2025 (92.7% مقابل 88.3%). النموذج الكثيف 27B يوسّع الفارق أكثر بنتيجة 77.2% SWE-bench، و59.3 Terminal-Bench، و83.9 LiveCodeBench، و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus بنتيجة 45.3). كلتا العائلتين توفران نماذج MoE وكثيفة مفتوحة الأوزان بتراخيص مرنة.

جرّب Qwen 3.6 عرض المعايير

المعايير

Qwen 3.6 مقابل Gemma 4 - مقارنة معايير تفصيلية عبر 8 تقييمات

نتائج معايير شاملة تقارن بين عائلتي النماذج في هندسة البرمجيات والبرمجة وعمليات الطرفية والاستدلال الرياضي وتوليد الواجهات الأمامية ومهارات البرمجة العملية.

يُظهر Qwen 3.6 تفوقاً ملحوظاً ومتسقاً في الأداء على Gemma 4 عبر جميع المعايير المتاحة. الفارق واضح بشكل خاص على SWE-bench Verified، حيث يتقدم Qwen 3.6 بأكثر من 20 نقطة مئوية في مقارنة MoE وأكثر من 25 نقطة مع النموذج الكثيف 27B. نتيجة SkillsBench (48.2 للنموذج 27B، متفوقاً على Claude 4.5 Opus بنتيجة 45.3) تُبرز قوة Qwen في الحكم الهندسي العملي بما يتجاوز توليد الأكواد الخام.

جرّب Qwen 3.6 حمّل النماذج

رسم بياني لمقارنة المعايير يوضح أداء Qwen 3.6 مقابل Gemma 4 على SWE-bench وTerminal-Bench وAIME وLiveCodeBench وSkillsBench وQwenWebBench

SWE-bench Verified: Qwen 3.6 27B 77.2% مقابل Gemma 4 26B A4B 52.0% (+25.2 نقطة)

Terminal-Bench 2.0: Qwen 3.6 27B 59.3 مقابل Gemma 4 26B A4B 42.9 (+38%)

AIME 2025: Qwen 3.6 35B A3B 92.7% مقابل Gemma 4 26B A4B 88.3%

SkillsBench: Qwen 3.6 27B 48.2 يتفوق على Claude 4.5 Opus (45.3)

QwenWebBench: Qwen 3.6 27B 1487 - الرائد في توليد أكواد الواجهات الأمامية

جدول المعايير

Qwen 3.6 مقابل Gemma 4 - النتائج الكاملة عبر جميع التقييمات

مقارنة معايير جنباً إلى جنب لمتغيرات نماذج Qwen 3.6 وGemma 4 في هندسة البرمجيات والبرمجة والرياضيات وتقييمات المهارات العملية.

Benchmark	Qwen 3.6 27B كثيف الأفضل أداءً	Qwen 3.6 35B A3B MoE 3B نشط	Gemma 4 26B A4B MoE 4B نشط	Gemma 4 31B كثيف
SWE-bench Verified هندسة برمجيات واقعية	77.2%	73.4%	52.0%	-
Terminal-Bench 2.0 عمليات الطرفية وإدارة الأنظمة	59.3	51.5	42.9	-
AIME 2025 رياضيات المسابقات	94.1%	92.7%	88.3%	-
LiveCodeBench توليد أكواد تنافسي	83.9	80.4	-	-
SkillsBench مهارات البرمجة العملية	48.2	-	-	-
QwenWebBench توليد أكواد الواجهات الأمامية	1487	1397	-	-
NL2Repo من اللغة الطبيعية إلى المستودع	36.2	-	-	-
Claw-Eval Avg برمجة وكيلية شاملة	72.4	68.7	-	-
Active parameters المعاملات المحسوبة لكل رمز	27B (all)	3B (of 35B)	4B (of 26B)	31B (all)

نتائج المعايير من الإصدارات الرسمية للنماذج. بيانات Qwen 3.6 من Alibaba (مارس 2026)، بيانات Gemma 4 من Google. نتائج SkillsBench وQwenWebBench من معايير Qwen الرسمية.

منظومة Qwen

اختر عائلة النماذج التي تتصدر المعايير الأهم

يقدم Qwen 3.6 أداءً أقوى بشكل ملحوظ من Gemma 4 في هندسة البرمجيات (+25 نقطة SWE-bench)، وعمليات الطرفية (+38% Terminal-Bench)، والاستدلال الرياضي. كل ذلك بمعاملات نشطة أقل واستدلال أسرع.

استكشف نماذج Qwen التوثيق الرسمي

Qwen 3.6 27B

أفضل نموذج مفتوح الأوزان للبرمجة، 77.2% SWE-bench

جرّب 27B

Qwen 3.6 35B A3B

MoE لبطاقات المستهلكين، 73.4% SWE-bench

جرّب 35B

شغّل محلياً

انشر باستخدام Ollama أو vLLM أو llama.cpp

ابدأ الآن

الوصول عبر API

API متوافقة مع OpenAI، $0.40/مليون رمز إدخال

عرض API

مقارنة النماذج

قارن جميع نماذج Qwen 3.6

قارن

المجتمع

انضم إلى مجتمع مطوري Qwen

انضم

جرّب Qwen 3.6

جرّب فارق الأداء بنفسك - تقدّم بأكثر من 25 نقطة على SWE-bench

تحدث مع Qwen 3.6 مجاناً واكتشف لماذا يتفوق على Gemma 4 بأكثر من 25 نقطة مئوية على SWE-bench، و38% على Terminal-Bench، ويتغلب على Claude 4.5 Opus في SkillsBench. مفتوح الأوزان، قابل للتشغيل محلياً، ومتاح عبر API.

ابدأ المحادثة حمّل النماذج