Qwen Code

برمجة وكيلية تحل مشكلات GitHub الحقيقية، تتقن سير عمل الطرفية، وتتفوق على Claude في SkillsBench

تقدم عائلة Qwen 3.6 أداء برمجي متميزاً على كل المستويات. نموذج Plus يسجل 78.8% على SWE-bench Verified و61.6 على Terminal-Bench 2.0. النموذج الكثيف 27B يحقق 77.2% SWE-bench، و48.2 على SkillsBench (متفوقاً على Claude 4.5 Opus عند 45.3)، و1487 على QwenWebBench لتوليد كود الواجهة الأمامية. نموذج 35B A3B MoE يحقق 73.4% SWE-bench على GPU استهلاكية. جميع النماذج تعمل مع Claude Code وOpenClaw وAider وContinue.dev عبر API المتوافق مع OpenAI. preserve_thinking يحافظ على حالة الاستدلال عبر تكرارات حلقة الوكيل للتطوير التكراري.

قدرات البرمجة

برمجة full-stack من الطرفية إلى الإنتاج - مع الحفاظ على الاستدلال

تتفوق نماذج Qwen 3.6 في كل مرحلة من دورة حياة تطوير البرمجيات. من فهم قواعد الكود الكبيرة وتوليد الكود إلى تصحيح الأخطاء والاختبار والنشر عبر سير عمل الطرفية. معامل preserve_thinking يحافظ على سياق الاستدلال عبر دورات التطوير التكراري.

برمجة وكيلية (SWE-bench)

يحل مشكلات GitHub الحقيقية بشكل مستقل من البداية إلى النهاية. 78.8% على SWE-bench Verified (Plus) و77.2% (27B) يثبتان القدرة على التنقل في المستودعات وتحديد الأسباب الجذرية وتنفيذ الإصلاحات وتقديم تصحيحات عاملة بدون تدخل بشري. نموذج 35B A3B يحقق 73.4% على GPU استهلاكية. هذه النتائج تضع Qwen 3.6 بين أفضل النماذج للهندسة البرمجية المستقلة.

توليد كود الواجهة الأمامية (QwenWebBench)

نموذج 27B يسجل 1487 على QwenWebBench ونموذج 35B A3B يسجل 1397، مما يثبت قدرات قوية في توليد كود الواجهة الأمامية. يولد مكونات React وVue وNext.js كاملة مع تنميط TypeScript صحيح وسمات إمكانية الوصول وتخطيطات متجاوبة وتكامل نظام التصميم. يتعامل مع CSS-in-JS وTailwind CSS وأنماط مكتبات المكونات. معامل preserve_thinking يساعد في الحفاظ على سياق التصميم عبر بناء هيكل الواجهة الأمامية متعدد الملفات.

عمليات الطرفية (Terminal-Bench)

61.6 على Terminal-Bench 2.0 (Plus) و59.3 (27B) - إتقان الطرفية على مستوى الخبراء. يتعامل مع سير عمل shell المعقدة متعددة الخطوات ومهام إدارة النظام وجلسات تصحيح الأخطاء وإدارة خطوط أنابيب CI/CD وتنسيق Docker وأتمتة البنية التحتية. نموذج 35B A3B يسجل 51.5، لا يزال قوياً لنموذج على GPU استهلاكية.

SkillsBench - يتفوق على Claude 4.5 Opus

نموذج 27B يسجل 48.2 على SkillsBench، متفوقاً على Claude 4.5 Opus عند 45.3. يقيّم SkillsBench مهارات البرمجة العملية بما في ذلك مراجعة الكود وإعادة الهيكلة وتصميم API واستراتيجية الاختبار واتخاذ القرارات المعمارية. هذا المعيار يقيس نوع الحكم الهندسي الدقيق المهم في التطوير الواقعي، وليس مجرد توليد الكود.

استدلال على مستوى المستودع (NL2Repo)

نموذج 27B يسجل 36.2 على NL2Repo، مما يثبت القدرة على ترجمة أوصاف اللغة الطبيعية إلى هياكل مستودعات كاملة. يفهم التبعيات عبر الملفات وحدود الوحدات والأنماط المعمارية واتفاقيات المشروع عبر مستودعات كاملة. نافذة السياق 1M (Plus) تتيح معالجة قواعد كود كاملة في مرور واحد لفهم شامل.

توليد الكود (LiveCodeBench)

83.9 على LiveCodeBench (27B) و80.4 (35B A3B) لتوليد كود بمستوى تنافسي. ينتج كوداً نظيفاً واصطلاحياً في Python وTypeScript وRust وGo وJava وC++ وأكثر من 20 لغة مع معالجة أخطاء صحيحة وتوثيق وتغطية اختبارات. يتعامل مع المشكلات الخوارزمية وتنفيذات هياكل البيانات وتحديات تصميم الأنظمة.

تكامل أدوات البرمجة

يعمل مع Claude Code وOpenClaw وAider وContinue.dev وQwen Code عبر API المتوافق مع OpenAI. اضبط عنوان URL الأساسي على نقطة نهاية DashScope أو OpenRouter أو Ollama المحلي وابدأ البرمجة فوراً. معامل preserve_thinking قيّم بشكل خاص في حلقات وكيل Claude Code وOpenClaw حيث الحفاظ على حالة الاستدلال عبر التكرارات يقلل الاستدلال المتكرر ويحسن دقة الإصلاحات.

تصحيح الأخطاء والاختبار وClaw-Eval

نموذج 27B يسجل 72.4 على متوسط Claw-Eval ونموذج 35B A3B يسجل 68.7، مما يقيس قدرة البرمجة الوكيلية من البداية إلى النهاية. يتتبع الأخطاء عبر مكدسات استدعاء معقدة ويحدد الأسباب الجذرية من سجلات الأخطاء ويولد مجموعات اختبار شاملة. يدعم اختبارات الوحدة واختبارات التكامل وأطر اختبار من البداية إلى النهاية والاختبار القائم على الخصائص في جميع اللغات والأطر الرئيسية.

معايير البرمجة

نتائج متميزة في كل تقييم برمجي

تحتل نماذج Qwen 3.6 باستمرار مراتب بين الأفضل في معايير هندسة البرمجيات وتوليد الكود وعمليات الطرفية ومهارات البرمجة العملية.

معايير هندسة البرمجيات

  • SWE-bench Verified: 78.8% (Plus) / 77.2% (27B) / 73.4% (35B A3B)
  • Terminal-Bench 2.0: 61.6 (Plus) / 59.3 (27B) / 51.5 (35B A3B)
  • SkillsBench: 48.2 (27B) - يتفوق على Claude 4.5 Opus (45.3)
  • Claw-Eval Avg: 72.4 (27B) / 68.7 (35B A3B)
  • LiveCodeBench: 83.9 (27B) / 80.4 (35B A3B)
  • QwenWebBench: 1487 (27B) / 1397 (35B A3B) - توليد الواجهة الأمامية
  • NL2Repo: 36.2 (27B) - من اللغة الطبيعية إلى المستودع
  • SWE-bench Pro: 56.6 (Plus)

الأدوات وخيارات النماذج

  • يعمل مع: Claude Code، OpenClaw، Aider، Continue.dev، Qwen Code
  • 27B كثيف: أفضل برمجة مفتوحة الأوزان، 77.2% SWE-bench
  • 35B A3B MoE: 73.4% SWE-bench على GPU استهلاكية (حوالي 21 جيجابايت VRAM)
  • Plus: 78.8% SWE-bench، سياق 1M، preserve_thinking
  • الواجهة الأمامية: React، Vue، Next.js مع دعم TypeScript
  • preserve_thinking: يحافظ على الاستدلال عبر التكرارات الوكيلية

منظومة Qwen

نماذج برمجة لكل حجم - من GPU استهلاكية إلى أداء متقدم

من 35B A3B الذي يعمل على GPU استهلاكية واحدة إلى Plus بسياق 1M وpreserve_thinking، تغطي عائلة Qwen 3.6 كل سيناريو نشر للبرمجة. جميع النماذج تعمل مع Claude Code وOpenClaw وAider وContinue.dev.

Qwen 3.6 27B

كثيف، 77.2% SWE-bench، 48.2 SkillsBench

اعرف المزيد

Qwen 3.6 35B A3B

MoE، 73.4% SWE-bench، GPU استهلاكية

اعرف المزيد

Qwen 3.6 Plus

78.8% SWE-bench، سياق 1M، preserve_thinking

اعرف المزيد

إعداد Ollama

شغّل Qwen Code محلياً بأمر واحد

ابدأ

مرجع API

نقاط نهاية متوافقة مع OpenAI لمهام البرمجة

عرض API

المجتمع

انضم إلى مجتمع مطوري Qwen

انضم

ابدأ البرمجة

مستعد للبرمجة مع Qwen 3.6؟ 78.8% SWE-bench، يعمل مع أدواتك المفضلة

ابدأ بالدردشة مجاناً أو ادمج عبر API المتوافق مع OpenAI. يعمل مع Claude Code وOpenClaw وAider وContinue.dev. اختر من النماذج مفتوحة الأوزان التي يمكنك تشغيلها محلياً أو Plus لأقصى أداء مع preserve_thinking.