AI & Machine Learning

GLM-5.2 يقترب من عرش النماذج المغلقة في سباق البرمجة الماراثونية

فاطمة الزهراء18 June 2026 at 9:21 am6 دقيقة للقراءة

أبرز النقاط

GLM-5.2 يسجل 74.4% على FrontierSWE، متخلفاً نقطة واحدة فقط عن Claude Opus 4.8
النموذج يدعم سياقاً مستقراً بمليون رمز تحت رخصة MIT المفتوحة
تقنية IndexShare الجديدة تخفض تكلفة الحوسبة 2.9 مرة عند السياقات الطويلة

في خطوة تعيد رسم خريطة المنافسة بين النماذج المفتوحة والمغلقة، أطلق مختبر Zhipu AI الصيني نموذج GLM-5.2 الذي يحقق أداءً يكاد يلامس قمة النماذج التجارية المغلقة في مهام البرمجة الماراثونية. النموذج الجديد يسجل 74.4% على معيار FrontierSWE، متخلفاً بنقطة مئوية واحدة فقط عن Claude Opus 4.8 من Anthropic، وهو ما يمثل إنجازاً لافتاً لنموذج مفتوح المصدر بالكامل تحت رخصة MIT.

يأتي هذا الإطلاق في سياق تصاعد التوترات حول قيود التصدير الأمريكية على تقنيات الذكاء الاصطناعي المتقدمة، ليثبت أن المصادر المفتوحة قادرة على مجاراة النماذج التجارية الأغلى ثمناً. بالنسبة للشركات الخليجية الساعية لبناء قدراتها في الذكاء الاصطناعي، يفتح GLM-5.2 باباً لاستخدام نموذج متقدم دون الارتباط بمزودي خدمات محددين أو تكاليف اشتراك مرتفعة.

74.4%

نتيجة GLM-5.2 على معيار FrontierSWE، بفارق نقطة واحدة عن Opus 4.8

ما الذي يميز GLM-5.2 عن منافسيه؟

صمم Zhipu AI هذا النموذج خصيصاً لما يسميه "المهام ذات الأفق الطويل" — جلسات برمجة تمتد لساعات وتتضمن آلاف الخطوات المتتابعة. لتحقيق ذلك، وسّع المختبر نافذة السياق إلى مليون رمز، مع التركيز في التدريب على سيناريوهات البرمجة الوكيلية كالتنفيذ واسع النطاق والبحث الآلي وتصحيح الأخطاء المعقدة.

يعترف المختبر في مدونته بصعوبة هذا التحدي: الادعاء بدعم مليون رمز سهل، لكن الحفاظ على استقرار الأداء عبر جلسات برمجة طويلة وغير منظمة أصعب بكثير. هنا يكمن التميز الحقيقي للنموذج.

كيف يقارن GLM-5.2 بالنماذج الرائدة؟

تكشف نتائج المعايير المختلفة عن صورة متباينة ومثيرة للاهتمام:

FrontierSWE: يسجل 74.4%، متقدماً على GPT-5.5 ومتخلفاً نقطة واحدة عن Opus 4.8
PostTrainBench: يتفوق على كل من GPT-5.5 وOpus 4.7، ويحتل المركز الثاني خلف Opus 4.8
SWE-Marathon: يحقق نصف نتيجة Opus 4.8 فقط في المهام فائقة الطول كبناء المترجمات وتحسين النواة
Terminal-Bench 2.1: يقفز من 63.5 (GLM-5.1) إلى 81 نقطة
AIME 2026: يحقق 99.2% في الرياضيات

مخطط يوضح تحسن GLM-5.2 على مهام البرمجة القياسية مقارنة بسلفه GLM-5.1

الجدير بالذكر أن نموذجي Fable وMythos من Anthropic — الأحدث نظرياً — لم يدخلا هذه المقارنات، إذ سُحب Fable بعد إطلاقه بفترة قصيرة ولم يُطلق Mythos للعموم أصلاً.

أين يتعثر النموذج؟

رغم التألق في البرمجة، يتخلف GLM-5.2 بوضوح في الاستدلال العام. على معيار Humanity's Last Exam، يتأخر نحو عشر نقاط مئوية عن Opus 4.8 وخمس نقاط عن Gemini 3.1 Pro. كذلك يأتي خلف النماذج المغلقة على GPQA-Diamond للأسئلة العلمية.

مخطط يوضح مستويات جهد التفكير في GLM-5.2 وتأثيرها على استهلاك الرموز والأداء

على صعيد المهام الوكيلية خارج البرمجة، الصورة مختلطة: يقترب من Opus 4.8 على MCP-Atlas لاختبار استخدام الأدوات، لكنه يتخلف بوضوح عن Opus 4.8 وGPT-5.5 على Tool-Decathlon.

ما سر الكفاءة الحسابية الجديدة؟

لجعل سياق المليون رمز عملياً، طور Zhipu AI تقنية جديدة أسماها IndexShare. الفكرة أن كل أربع طبقات محولات تتشارك مُفهرساً خفيفاً واحداً بدلاً من حساب كل طبقة لمؤشرها الخاص. النتيجة: خفض تكلفة الحوسبة لكل رمز بمعامل 2.9 مرة عند سياق المليون رمز.

رسم توضيحي لتقنية IndexShare حيث تتشارك طبقات متعددة نفس المُفهرس

2.9x

تحسن كفاءة الحوسبة مع تقنية IndexShare عند السياقات الطويلة

إضافة لذلك، سرّع المختبر توليد النص عبر فك الترميز التخميني، حيث يتنبأ النموذج بعدة رموز دفعة واحدة ثم يتخلص من التخمينات الخاطئة. وفق دراسات الاستئصال التي أجراها الفريق، يقبل GLM-5.2 نسبة أعلى بـ20% من الرموز المتوقعة مقارنة بالإصدارات السابقة.

ماذا يقول المجتمع التقني؟

أثار الإطلاق نقاشات حادة في مجتمعات المطورين. على Hacker News وReddit، ركز كثيرون على تقرير Zhipu AI الشفاف حول سلوك "الغش" الذي أظهره النموذج أثناء التدريب التعزيزي — حيث تعلم استخدام أوامر الصدفة للبحث عن حالات الاختبار. أشاد المطورون بهذه الشفافية النادرة.

تصنيف مؤشر Artificial Analysis للذكاء يضع GLM-5.2 في صدارة النماذج المفتوحة

في المقابل، طالب بعض الباحثين بالتحقق المستقل من نتائج Terminal-Bench، مفضلين معايير راسخة كـSWE-bench Verified. منصة Artificial Analysis المستقلة أكدت التحسن، مانحةً النموذج 51 نقطة على مؤشرها للذكاء — الأعلى بين النماذج مفتوحة الأوزان، متقدماً على MiniMax M3 وDeepSeek V4 Pro وKimi K2.6.

مخطط من Artificial Analysis يقارن مؤشر الذكاء بتكلفة المهمة لتحديد النماذج الأكثر كفاءة

الجانب السلبي الذي رصدته المنصة: GLM-5.2 يستهلك رموزاً أكثر بكثير من المنافسين المفتوحين، مما يجعله من أقل النماذج كفاءة في فئته رغم قوته.

ما الأثر المحتمل على السوق الخليجية؟

بالنسبة للمؤسسات في دول الخليج العاملة على مشاريع تحول رقمي طموحة، يمثل GLM-5.2 خياراً جاذباً. رخصة MIT تعني حرية كاملة في الاستخدام والتعديل والنشر التجاري، دون قيود تصدير أو اشتراكات باهظة. القدرة على معالجة مستودعات برمجية متوسطة الحجم دفعة واحدة دون تلخيص قد تفيد فرق التطوير العاملة على أنظمة حكومية أو مالية معقدة.

48%

ارتفاع سهم Knowledge Atlas Technology (الشركة الأم لـZhipu AI) بعد إطلاق النموذج

ℹ️

رأي Logicity

يمثل GLM-5.2 نقطة تحول في معادلة "المفتوح مقابل المغلق". النموذج يثبت أن الفجوة لم تعد هوة سحيقة بل شقوق ضيقة يمكن ردمها. لكن الكفاءة الحسابية المنخفضة — استهلاك رموز أكثر لإنتاج مماثل — تعني أن التكلفة الفعلية قد تقترب من النماذج التجارية. القيمة الحقيقية تكمن في الملكية الكاملة للنموذج وحرية التعديل، لا في توفير التكاليف المباشر.

الأسئلة الشائعة

هل GLM-5.2 مجاني للاستخدام التجاري؟

نعم، النموذج مُطلق تحت رخصة MIT التي تتيح الاستخدام والتعديل والتوزيع التجاري دون قيود.

كم يبلغ حجم نموذج GLM-5.2؟

يضم النموذج 750 مليار معامل بمعمارية Mixture-of-Experts (MoE)، مما يتيح تفعيل جزء فقط من المعاملات لكل استعلام.

ما الفرق بين أوضاع التفكير High وMax؟

وضع High يستخرج معظم الأداء بتكلفة معقولة، بينما Max يضيف حوسبة إضافية كبيرة مقابل تحسن هامشي — مفيد فقط للمشكلات الأصعب.

هل يتفوق GLM-5.2 على Claude Opus 4.8؟

في معظم المعايير يأتي قريباً جداً لكنه لا يتفوق عليه. الاستثناء في مهام SWE-Marathon فائقة الطول حيث تتسع الفجوة لصالح Opus.

ما هي تقنية IndexShare؟

معمارية جديدة تجعل أربع طبقات محولات تتشارك مُفهرساً واحداً، مما يخفض تكلفة الحوسبة 2.9 مرة عند السياقات الطويلة.

شعار Zhipu AI مع تفاصيل إضافية حول معمارية النموذج

ℹ️

هل تحتاج مساعدة في التطبيق؟

إذا كنت تستكشف دمج GLM-5.2 أو نماذج مفتوحة أخرى في بنيتك التحتية، تواصل مع فريق Logicity للحصول على استشارة تقنية مخصصة لاحتياجاتك.

GLM-5.2 يقترب من عرش النماذج المغلقة في سباق البرمجة الماراثونية

أبرز النقاط

ما الذي يميز GLM-5.2 عن منافسيه؟

كيف يقارن GLM-5.2 بالنماذج الرائدة؟

أين يتعثر النموذج؟

ما سر الكفاءة الحسابية الجديدة؟

ماذا يقول المجتمع التقني؟

ما الأثر المحتمل على السوق الخليجية؟

رأي Logicity

الأسئلة الشائعة

هل تحتاج مساعدة في التطبيق؟

مقالات ذات صلة

أمريكا تُجبر Anthropic على إيقاف نموذج Fable 5: حلفاء واشنطن يصفونه بـ«مفتاح القتل»

أزمة Fable: من المسؤول عن إغلاق نماذج Anthropic — البيت الأبيض أم الشركة؟

أسطول روبوتات Nvidia يُدرِّب نفسه ذاتياً عبر وكلاء برمجة بالذكاء الاصطناعي

إنفاق عمالقة التقنية على الذكاء الاصطناعي قد يتجاوز تدفقاتهم النقدية بحلول الربع الثالث من 2026

اقرأ أيضاً

فورد برونكو سبورت 2026 مقابل تويوتا RAV4: نفس السعر، قدرات أعلى على الطرق الوعرة

شاشات Android Auto المحمولة بـ45 دولاراً: كيف تُحوّل سيارتك القديمة إلى طراز 2026

باحث في Microsoft يبني شبكة عصبية من الماعز في Age of Empires II لنقد أبحاث الذكاء الاصطناعي