Qwen 3.6 مقابل Kimi K2.6
قوتان وكيليتان - Kimi K2.6 يتصدر Terminal-Bench، وQwen 3.6 يتصدر SWE-bench مع مرونة مفتوحة الأوزان
حقق Kimi K2.6 من Moonshot AI نتيجة 66.7% على Terminal-Bench 2.0 واستمر في أكثر من 4,000 استدعاء أداة على مدار 13 ساعة، مما يُظهر تحملاً استثنائياً للوكلاء طويلي التشغيل. يحقق Qwen 3.6 Plus نتيجة 61.6 على Terminal-Bench لكنه يتصدر بنتيجة 78.8% SWE-bench Verified ومعامل preserve_thinking للحفاظ على حالة الاستدلال. النموذج المفتوح الأوزان 27B يحقق 77.2% SWE-bench و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus). يوفر Qwen نماذج مفتوحة الأوزان ونشراً محلياً وأسعار API بقيمة $0.40/$2.40 لكل مليون رمز.
المعايير
Qwen 3.6 مقابل Kimi K2.6 - مقارنة شاملة للمعايير الوكيلية
كلا النموذجين يمثلان أحدث ما توصلت إليه البرمجة الوكيلية. Kimi K2.6 يتصدر في Terminal-Bench والتحمل، بينما Qwen 3.6 يتصدر في SWE-bench وSkillsBench ويوفر تغطية معايير أوسع مع خيارات نشر مفتوحة الأوزان.
يتطور مشهد الذكاء الاصطناعي الوكيلي بسرعة، مع كل من Qwen 3.6 وKimi K2.6 يدفعان الحدود في اتجاهات مختلفة. نتيجة Kimi K2.6 في Terminal-Bench (66.7%) واختبارات التحمل (أكثر من 4,000 استدعاء أداة على مدار 13 ساعة) تُظهر قدرات استثنائية للوكلاء طويلي التشغيل. يوفر Qwen 3.6 منظومة أكمل بنتيجة 78.8% SWE-bench ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار تنافسية وتكامل مع أدوات البرمجة الشائعة.


Terminal-Bench 2.0: Kimi K2.6 66.7% مقابل Qwen 3.6 Plus 61.6
Kimi K2.6: أكثر من 4,000 استدعاء أداة مستدام على مدار 13 ساعة
Qwen 3.6 Plus: 78.8% SWE-bench Verified
Qwen 3.6 27B: 77.2% SWE-bench، 48.2 SkillsBench (يتفوق على Claude 4.5 Opus)
Qwen 3.6 27B: 83.9 LiveCodeBench، 1487 QwenWebBench، 72.4 Claw-Eval
جدول المعايير
Qwen 3.6 مقابل Kimi K2.6 - نتائج تفصيلية عبر جميع التقييمات
بيانات المعايير المتاحة لكلتا عائلتي النماذج عبر البرمجة الوكيلية وهندسة البرمجيات والمهارات العملية وتقييمات التحمل.
| Benchmark | Qwen 3.6 Plus مملوك | Qwen 3.6 27B كثيف مفتوح الأوزان | Qwen 3.6 35B A3B MoE مفتوح الأوزان | Kimi K2.6 مملوك متصدر Terminal-Bench |
|---|---|---|---|---|
Terminal-Bench 2.0 عمليات الطرفية | 61.6 | 59.3 | 51.5 | 66.7 |
SWE-bench Verified هندسة برمجيات واقعية | 78.8% | 77.2% | 73.4% | - |
SkillsBench مهارات البرمجة العملية | - | 48.2 | - | - |
LiveCodeBench توليد أكواد تنافسي | - | 83.9 | 80.4 | - |
QwenWebBench توليد أكواد الواجهات الأمامية | - | 1487 | 1397 | - |
Claw-Eval Avg برمجة وكيلية شاملة | - | 72.4 | 68.7 | - |
Max tool calls (single session) تحمل الوكيل | - | - | - | 4,000+ |
Max session duration التشغيل المستدام | - | - | - | 13 hours |
preserve_thinking استمرارية حالة الاستدلال | Yes | No | No | No |
Open-weight models النشر المحلي متاح | No | Yes (Apache 2.0) | Yes (Apache 2.0) | No |
بيانات Qwen 3.6 من الإصدار الرسمي (مارس 2026). بيانات Kimi K2.6 من إصدار Moonshot AI (20 أبريل 2026). مرجع SkillsBench: Claude 4.5 Opus يحقق 45.3.
منظومة Qwen
أداء وكيلي مع مرونة مفتوحة الأوزان وأسعار تنافسية
يجمع Qwen 3.6 بين معايير وكيلية قوية (78.8% SWE-bench) ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار $0.40/مليون رمز وتكامل مع Claude Code وOpenClaw وAider وContinue.dev.
جرّب Qwen 3.6
اكتشف قدرات Qwen 3.6 الوكيلية اليوم - محادثة مجانية، مفتوح الأوزان، أسعار تنافسية
تحدث مجاناً، أو شغّل محلياً بنماذج مفتوحة الأوزان بترخيص Apache 2.0، أو ادمج عبر API المتوافقة مع OpenAI بسعر $0.40/$2.40 لكل مليون رمز. preserve_thinking لسير العمل الوكيلي، يعمل مع Claude Code وOpenClaw وAider وContinue.dev.