Qwen 3.6 مقابل Kimi K2.6

قوتان وكيليتان - Kimi K2.6 يتصدر Terminal-Bench، وQwen 3.6 يتصدر SWE-bench مع مرونة مفتوحة الأوزان

حقق Kimi K2.6 من Moonshot AI نتيجة 66.7% على Terminal-Bench 2.0 واستمر في أكثر من 4,000 استدعاء أداة على مدار 13 ساعة، مما يُظهر تحملاً استثنائياً للوكلاء طويلي التشغيل. يحقق Qwen 3.6 Plus نتيجة 61.6 على Terminal-Bench لكنه يتصدر بنتيجة 78.8% SWE-bench Verified ومعامل preserve_thinking للحفاظ على حالة الاستدلال. النموذج المفتوح الأوزان 27B يحقق 77.2% SWE-bench و48.2 SkillsBench (متفوقاً على Claude 4.5 Opus). يوفر Qwen نماذج مفتوحة الأوزان ونشراً محلياً وأسعار API بقيمة $0.40/$2.40 لكل مليون رمز.

جرّب Qwen 3.6 عرض المعايير

المعايير

Qwen 3.6 مقابل Kimi K2.6 - مقارنة شاملة للمعايير الوكيلية

كلا النموذجين يمثلان أحدث ما توصلت إليه البرمجة الوكيلية. Kimi K2.6 يتصدر في Terminal-Bench والتحمل، بينما Qwen 3.6 يتصدر في SWE-bench وSkillsBench ويوفر تغطية معايير أوسع مع خيارات نشر مفتوحة الأوزان.

يتطور مشهد الذكاء الاصطناعي الوكيلي بسرعة، مع كل من Qwen 3.6 وKimi K2.6 يدفعان الحدود في اتجاهات مختلفة. نتيجة Kimi K2.6 في Terminal-Bench (66.7%) واختبارات التحمل (أكثر من 4,000 استدعاء أداة على مدار 13 ساعة) تُظهر قدرات استثنائية للوكلاء طويلي التشغيل. يوفر Qwen 3.6 منظومة أكمل بنتيجة 78.8% SWE-bench ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار تنافسية وتكامل مع أدوات البرمجة الشائعة.

جرّب Qwen 3.6 توثيق API

رسم بياني لمقارنة المعايير يوضح أداء Qwen 3.6 مقابل Kimi K2.6 على Terminal-Bench وSWE-bench وSkillsBench والمعايير الوكيلية

Terminal-Bench 2.0: Kimi K2.6 66.7% مقابل Qwen 3.6 Plus 61.6

Kimi K2.6: أكثر من 4,000 استدعاء أداة مستدام على مدار 13 ساعة

Qwen 3.6 Plus: 78.8% SWE-bench Verified

Qwen 3.6 27B: 77.2% SWE-bench، 48.2 SkillsBench (يتفوق على Claude 4.5 Opus)

Qwen 3.6 27B: 83.9 LiveCodeBench، 1487 QwenWebBench، 72.4 Claw-Eval

جدول المعايير

Qwen 3.6 مقابل Kimi K2.6 - نتائج تفصيلية عبر جميع التقييمات

بيانات المعايير المتاحة لكلتا عائلتي النماذج عبر البرمجة الوكيلية وهندسة البرمجيات والمهارات العملية وتقييمات التحمل.

Benchmark	Qwen 3.6 Plus مملوك	Qwen 3.6 27B كثيف مفتوح الأوزان	Qwen 3.6 35B A3B MoE مفتوح الأوزان	Kimi K2.6 مملوك متصدر Terminal-Bench
Terminal-Bench 2.0 عمليات الطرفية	61.6	59.3	51.5	66.7
SWE-bench Verified هندسة برمجيات واقعية	78.8%	77.2%	73.4%	-
SkillsBench مهارات البرمجة العملية	-	48.2	-	-
LiveCodeBench توليد أكواد تنافسي	-	83.9	80.4	-
QwenWebBench توليد أكواد الواجهات الأمامية	-	1487	1397	-
Claw-Eval Avg برمجة وكيلية شاملة	-	72.4	68.7	-
Max tool calls (single session) تحمل الوكيل	-	-	-	4,000+
Max session duration التشغيل المستدام	-	-	-	13 hours
preserve_thinking استمرارية حالة الاستدلال	Yes	No	No	No
Open-weight models النشر المحلي متاح	No	Yes (Apache 2.0)	Yes (Apache 2.0)	No

بيانات Qwen 3.6 من الإصدار الرسمي (مارس 2026). بيانات Kimi K2.6 من إصدار Moonshot AI (20 أبريل 2026). مرجع SkillsBench: Claude 4.5 Opus يحقق 45.3.

منظومة Qwen

أداء وكيلي مع مرونة مفتوحة الأوزان وأسعار تنافسية

يجمع Qwen 3.6 بين معايير وكيلية قوية (78.8% SWE-bench) ونماذج مفتوحة الأوزان وpreserve_thinking وأسعار $0.40/مليون رمز وتكامل مع Claude Code وOpenClaw وAider وContinue.dev.

استكشف نماذج Qwen التوثيق الرسمي

Qwen 3.6 Plus

78.8% SWE-bench، preserve_thinking، $0.40/مليون

جرّب Plus

Qwen 3.6 27B

77.2% SWE-bench، 48.2 SkillsBench، مفتوح الأوزان

جرّب 27B

Qwen 3.6 35B A3B

73.4% SWE-bench، مناسب لـ Mac M4 16GB

جرّب 35B

الوصول عبر API

متوافق مع OpenAI، مستوى مجاني متاح

عرض API

شغّل محلياً

Ollama، vLLM، llama.cpp، SGLang

ابدأ الآن

المجتمع

انضم إلى مجتمع مطوري Qwen

انضم

جرّب Qwen 3.6

اكتشف قدرات Qwen 3.6 الوكيلية اليوم - محادثة مجانية، مفتوح الأوزان، أسعار تنافسية

تحدث مجاناً، أو شغّل محلياً بنماذج مفتوحة الأوزان بترخيص Apache 2.0، أو ادمج عبر API المتوافقة مع OpenAI بسعر $0.40/$2.40 لكل مليون رمز. preserve_thinking لسير العمل الوكيلي، يعمل مع Claude Code وOpenClaw وAider وContinue.dev.

ابدأ المحادثة حمّل النماذج