Qwen 3.6 مقابل Kimi K2.6

قوتان وكيليتان - Kimi K2.6 يتصدر Terminal-Bench، وQwen 3.6 يتصدر SWE-bench مع مرونة مفتوحة الأوزان

حقق Kimi K2.6 من Moonshot AI نتيجة 66.7% على Terminal-Bench 2.0 واستمر في أكثر من 4,000 استدعاء أداة على مدار 13 ساعة، مما يُظهر تحملاً استثنائياً للوكلاء طويلي التشغيل. يحقق Qwen 3.6 Plus نتيجة 61.6 على Terminal-Bench لكنه يتصدر بنتيجة 78.8% SWE-bench Verified ومعامل preserve_thinking للحفاظ على حالة الاستدلال. النموذج المفتوح الأوزان 27B يحقق 77.2% SWE-bench و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus). يوفر Qwen نماذج مفتوحة الأوزان ونشراً محلياً وأسعار API بقيمة $0.40/$2.40 لكل مليون رمز.

المعايير

Qwen 3.6 مقابل Kimi K2.6 - مقارنة شاملة للمعايير الوكيلية

كلا النموذجين يمثلان أحدث ما توصلت إليه البرمجة الوكيلية. Kimi K2.6 يتصدر في Terminal-Bench والتحمل، بينما Qwen 3.6 يتصدر في SWE-bench وSkillsBench ويوفر تغطية معايير أوسع مع خيارات نشر مفتوحة الأوزان.

يتطور مشهد الذكاء الاصطناعي الوكيلي بسرعة، مع كل من Qwen 3.6 وKimi K2.6 يدفعان الحدود في اتجاهات مختلفة. نتيجة Kimi K2.6 في Terminal-Bench (66.7%) واختبارات التحمل (أكثر من 4,000 استدعاء أداة على مدار 13 ساعة) تُظهر قدرات استثنائية للوكلاء طويلي التشغيل. يوفر Qwen 3.6 منظومة أكمل بنتيجة 78.8% SWE-bench ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار تنافسية وتكامل مع أدوات البرمجة الشائعة.

رسم بياني لمقارنة المعايير يوضح أداء Qwen 3.6 مقابل Kimi K2.6 على Terminal-Bench وSWE-bench وSkillsBench والمعايير الوكيلية

Terminal-Bench 2.0: Kimi K2.6 66.7% مقابل Qwen 3.6 Plus 61.6

Kimi K2.6: أكثر من 4,000 استدعاء أداة مستدام على مدار 13 ساعة

Qwen 3.6 Plus: 78.8% SWE-bench Verified

Qwen 3.6 27B: 77.2% SWE-bench، 48.2 SkillsBench (يتفوق على Claude 4.5 Opus)

Qwen 3.6 27B: 83.9 LiveCodeBench، 1487 QwenWebBench، 72.4 Claw-Eval

جدول المعايير

Qwen 3.6 مقابل Kimi K2.6 - نتائج تفصيلية عبر جميع التقييمات

بيانات المعايير المتاحة لكلتا عائلتي النماذج عبر البرمجة الوكيلية وهندسة البرمجيات والمهارات العملية وتقييمات التحمل.

Benchmark
Qwen 3.6 Plus
مملوك
Qwen 3.6 27B
كثيف مفتوح الأوزان
Qwen 3.6 35B A3B
MoE مفتوح الأوزان
Kimi K2.6
مملوك
متصدر Terminal-Bench
Terminal-Bench 2.0
عمليات الطرفية
61.659.351.566.7
SWE-bench Verified
هندسة برمجيات واقعية
78.8%77.2%73.4%-
SkillsBench
مهارات البرمجة العملية
-48.2--
LiveCodeBench
توليد أكواد تنافسي
-83.980.4-
QwenWebBench
توليد أكواد الواجهات الأمامية
-14871397-
Claw-Eval Avg
برمجة وكيلية شاملة
-72.468.7-
Max tool calls (single session)
تحمل الوكيل
---4,000+
Max session duration
التشغيل المستدام
---13 hours
preserve_thinking
استمرارية حالة الاستدلال
YesNoNoNo
Open-weight models
النشر المحلي متاح
NoYes (Apache 2.0)Yes (Apache 2.0)No

بيانات Qwen 3.6 من الإصدار الرسمي (مارس 2026). بيانات Kimi K2.6 من إصدار Moonshot AI (20 أبريل 2026). مرجع SkillsBench: Claude 4.5 Opus يحقق 45.3.

منظومة Qwen

أداء وكيلي مع مرونة مفتوحة الأوزان وأسعار تنافسية

يجمع Qwen 3.6 بين معايير وكيلية قوية (78.8% SWE-bench) ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار $0.40/مليون رمز وتكامل مع Claude Code وOpenClaw وAider وContinue.dev.

Qwen 3.6 Plus

78.8% SWE-bench، preserve_thinking، $0.40/مليون

جرّب Plus

Qwen 3.6 27B

77.2% SWE-bench، 48.2 SkillsBench، مفتوح الأوزان

جرّب 27B

Qwen 3.6 35B A3B

73.4% SWE-bench، مناسب لـ Mac M4 16GB

جرّب 35B

الوصول عبر API

متوافق مع OpenAI، مستوى مجاني متاح

عرض API

شغّل محلياً

Ollama، vLLM، llama.cpp، SGLang

ابدأ الآن

المجتمع

انضم إلى مجتمع مطوري Qwen

انضم

جرّب Qwen 3.6

اكتشف قدرات Qwen 3.6 الوكيلية اليوم - محادثة مجانية، مفتوح الأوزان، أسعار تنافسية

تحدث مجاناً، أو شغّل محلياً بنماذج مفتوحة الأوزان بترخيص Apache 2.0، أو ادمج عبر API المتوافقة مع OpenAI بسعر $0.40/$2.40 لكل مليون رمز. preserve_thinking لسير العمل الوكيلي، يعمل مع Claude Code وOpenClaw وAider وContinue.dev.