Qwen 3.6 مقابل Gemma 4

Qwen 3.6 يتفوق على Gemma 4 في البرمجة والطرفية والرياضيات ومعايير الواجهات الأمامية

مقارنة مباشرة بين عائلتي نماذج Qwen 3.6 وGoogle Gemma 4. يتفوق Qwen 3.6 35B A3B على Gemma 4 26B A4B في SWE-bench Verified (73.4% مقابل 52.0%)، وTerminal-Bench 2.0 (51.5 مقابل 42.9)، وAIME 2025 (92.7% مقابل 88.3%). النموذج الكثيف 27B يوسّع الفارق أكثر بنتيجة 77.2% SWE-bench، و59.3 Terminal-Bench، و83.9 LiveCodeBench، و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus بنتيجة 45.3). كلتا العائلتين توفران نماذج MoE وكثيفة مفتوحة الأوزان بتراخيص مرنة.

المعايير

Qwen 3.6 مقابل Gemma 4 - مقارنة معايير تفصيلية عبر 8 تقييمات

نتائج معايير شاملة تقارن بين عائلتي النماذج في هندسة البرمجيات والبرمجة وعمليات الطرفية والاستدلال الرياضي وتوليد الواجهات الأمامية ومهارات البرمجة العملية.

يُظهر Qwen 3.6 تفوقاً ملحوظاً ومتسقاً في الأداء على Gemma 4 عبر جميع المعايير المتاحة. الفارق واضح بشكل خاص على SWE-bench Verified، حيث يتقدم Qwen 3.6 بأكثر من 20 نقطة مئوية في مقارنة MoE وأكثر من 25 نقطة مع النموذج الكثيف 27B. نتيجة SkillsBench (48.2 للنموذج 27B، متفوقاً على Claude 4.5 Opus بنتيجة 45.3) تُبرز قوة Qwen في الحكم الهندسي العملي بما يتجاوز توليد الأكواد الخام.

رسم بياني لمقارنة المعايير يوضح أداء Qwen 3.6 مقابل Gemma 4 على SWE-bench وTerminal-Bench وAIME وLiveCodeBench وSkillsBench وQwenWebBench

SWE-bench Verified: Qwen 3.6 27B 77.2% مقابل Gemma 4 26B A4B 52.0% (+25.2 نقطة)

Terminal-Bench 2.0: Qwen 3.6 27B 59.3 مقابل Gemma 4 26B A4B 42.9 (+38%)

AIME 2025: Qwen 3.6 35B A3B 92.7% مقابل Gemma 4 26B A4B 88.3%

SkillsBench: Qwen 3.6 27B 48.2 يتفوق على Claude 4.5 Opus (45.3)

QwenWebBench: Qwen 3.6 27B 1487 - الرائد في توليد أكواد الواجهات الأمامية

جدول المعايير

Qwen 3.6 مقابل Gemma 4 - النتائج الكاملة عبر جميع التقييمات

مقارنة معايير جنباً إلى جنب لمتغيرات نماذج Qwen 3.6 وGemma 4 في هندسة البرمجيات والبرمجة والرياضيات وتقييمات المهارات العملية.

Benchmark
Qwen 3.6 27B
كثيف
الأفضل أداءً
Qwen 3.6 35B A3B
MoE 3B نشط
Gemma 4 26B A4B
MoE 4B نشط
Gemma 4 31B
كثيف
SWE-bench Verified
هندسة برمجيات واقعية
77.2%73.4%52.0%-
Terminal-Bench 2.0
عمليات الطرفية وإدارة الأنظمة
59.351.542.9-
AIME 2025
رياضيات المسابقات
94.1%92.7%88.3%-
LiveCodeBench
توليد أكواد تنافسي
83.980.4--
SkillsBench
مهارات البرمجة العملية
48.2---
QwenWebBench
توليد أكواد الواجهات الأمامية
14871397--
NL2Repo
من اللغة الطبيعية إلى المستودع
36.2---
Claw-Eval Avg
برمجة وكيلية شاملة
72.468.7--
Active parameters
المعاملات المحسوبة لكل رمز
27B (all)3B (of 35B)4B (of 26B)31B (all)

نتائج المعايير من الإصدارات الرسمية للنماذج. بيانات Qwen 3.6 من Alibaba (مارس 2026)، بيانات Gemma 4 من Google. نتائج SkillsBench وQwenWebBench من معايير Qwen الرسمية.

منظومة Qwen

اختر عائلة النماذج التي تتصدر المعايير الأهم

يقدم Qwen 3.6 أداءً أقوى بشكل ملحوظ من Gemma 4 في هندسة البرمجيات (+25 نقطة SWE-bench)، وعمليات الطرفية (+38% Terminal-Bench)، والاستدلال الرياضي. كل ذلك بمعاملات نشطة أقل واستدلال أسرع.

Qwen 3.6 27B

أفضل نموذج مفتوح الأوزان للبرمجة، 77.2% SWE-bench

جرّب 27B

Qwen 3.6 35B A3B

MoE لبطاقات المستهلكين، 73.4% SWE-bench

جرّب 35B

شغّل محلياً

انشر باستخدام Ollama أو vLLM أو llama.cpp

ابدأ الآن

الوصول عبر API

API متوافقة مع OpenAI، $0.40/مليون رمز إدخال

عرض API

مقارنة النماذج

قارن جميع نماذج Qwen 3.6

قارن

المجتمع

انضم إلى مجتمع مطوري Qwen

انضم

جرّب Qwen 3.6

جرّب فارق الأداء بنفسك - تقدّم بأكثر من 25 نقطة على SWE-bench

تحدث مع Qwen 3.6 مجاناً واكتشف لماذا يتفوق على Gemma 4 بأكثر من 25 نقطة مئوية على SWE-bench، و38% على Terminal-Bench، ويتغلب على Claude 4.5 Opus في SkillsBench. مفتوح الأوزان، قابل للتشغيل محلياً، ومتاح عبر API.