Qwen 3.6 مقابل Gemma 4
Qwen 3.6 يتفوق على Gemma 4 في البرمجة والطرفية والرياضيات ومعايير الواجهات الأمامية
مقارنة مباشرة بين عائلتي نماذج Qwen 3.6 وGoogle Gemma 4. يتفوق Qwen 3.6 35B A3B على Gemma 4 26B A4B في SWE-bench Verified (73.4% مقابل 52.0%)، وTerminal-Bench 2.0 (51.5 مقابل 42.9)، وAIME 2025 (92.7% مقابل 88.3%). النموذج الكثيف 27B يوسّع الفارق أكثر بنتيجة 77.2% SWE-bench، و59.3 Terminal-Bench، و83.9 LiveCodeBench، و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus بنتيجة 45.3). كلتا العائلتين توفران نماذج MoE وكثيفة مفتوحة الأوزان بتراخيص مرنة.
المعايير
Qwen 3.6 مقابل Gemma 4 - مقارنة معايير تفصيلية عبر 8 تقييمات
نتائج معايير شاملة تقارن بين عائلتي النماذج في هندسة البرمجيات والبرمجة وعمليات الطرفية والاستدلال الرياضي وتوليد الواجهات الأمامية ومهارات البرمجة العملية.
يُظهر Qwen 3.6 تفوقاً ملحوظاً ومتسقاً في الأداء على Gemma 4 عبر جميع المعايير المتاحة. الفارق واضح بشكل خاص على SWE-bench Verified، حيث يتقدم Qwen 3.6 بأكثر من 20 نقطة مئوية في مقارنة MoE وأكثر من 25 نقطة مع النموذج الكثيف 27B. نتيجة SkillsBench (48.2 للنموذج 27B، متفوقاً على Claude 4.5 Opus بنتيجة 45.3) تُبرز قوة Qwen في الحكم الهندسي العملي بما يتجاوز توليد الأكواد الخام.


SWE-bench Verified: Qwen 3.6 27B 77.2% مقابل Gemma 4 26B A4B 52.0% (+25.2 نقطة)
Terminal-Bench 2.0: Qwen 3.6 27B 59.3 مقابل Gemma 4 26B A4B 42.9 (+38%)
AIME 2025: Qwen 3.6 35B A3B 92.7% مقابل Gemma 4 26B A4B 88.3%
SkillsBench: Qwen 3.6 27B 48.2 يتفوق على Claude 4.5 Opus (45.3)
QwenWebBench: Qwen 3.6 27B 1487 - الرائد في توليد أكواد الواجهات الأمامية
جدول المعايير
Qwen 3.6 مقابل Gemma 4 - النتائج الكاملة عبر جميع التقييمات
مقارنة معايير جنباً إلى جنب لمتغيرات نماذج Qwen 3.6 وGemma 4 في هندسة البرمجيات والبرمجة والرياضيات وتقييمات المهارات العملية.
| Benchmark | Qwen 3.6 27B كثيف الأفضل أداءً | Qwen 3.6 35B A3B MoE 3B نشط | Gemma 4 26B A4B MoE 4B نشط | Gemma 4 31B كثيف |
|---|---|---|---|---|
SWE-bench Verified هندسة برمجيات واقعية | 77.2% | 73.4% | 52.0% | - |
Terminal-Bench 2.0 عمليات الطرفية وإدارة الأنظمة | 59.3 | 51.5 | 42.9 | - |
AIME 2025 رياضيات المسابقات | 94.1% | 92.7% | 88.3% | - |
LiveCodeBench توليد أكواد تنافسي | 83.9 | 80.4 | - | - |
SkillsBench مهارات البرمجة العملية | 48.2 | - | - | - |
QwenWebBench توليد أكواد الواجهات الأمامية | 1487 | 1397 | - | - |
NL2Repo من اللغة الطبيعية إلى المستودع | 36.2 | - | - | - |
Claw-Eval Avg برمجة وكيلية شاملة | 72.4 | 68.7 | - | - |
Active parameters المعاملات المحسوبة لكل رمز | 27B (all) | 3B (of 35B) | 4B (of 26B) | 31B (all) |
نتائج المعايير من الإصدارات الرسمية للنماذج. بيانات Qwen 3.6 من Alibaba (مارس 2026)، بيانات Gemma 4 من Google. نتائج SkillsBench وQwenWebBench من معايير Qwen الرسمية.
منظومة Qwen
اختر عائلة النماذج التي تتصدر المعايير الأهم
يقدم Qwen 3.6 أداءً أقوى بشكل ملحوظ من Gemma 4 في هندسة البرمجيات (+25 نقطة SWE-bench)، وعمليات الطرفية (+38% Terminal-Bench)، والاستدلال الرياضي. كل ذلك بمعاملات نشطة أقل واستدلال أسرع.
جرّب Qwen 3.6
جرّب فارق الأداء بنفسك - تقدّم بأكثر من 25 نقطة على SWE-bench
تحدث مع Qwen 3.6 مجاناً واكتشف لماذا يتفوق على Gemma 4 بأكثر من 25 نقطة مئوية على SWE-bench، و38% على Terminal-Bench، ويتغلب على Claude 4.5 Opus في SkillsBench. مفتوح الأوزان، قابل للتشغيل محلياً، ومتاح عبر API.