Ornith-1.0: نموذج مفتوح المصدر للبرمجة الوكيلية يتصدر المعايير القياسية

فاطمة الزهراء1 يوليو 2026 في 9:21 ص5 دقيقة للقراءة

أبرز النقاط

Ornith-1.0 يتفوق على نماذج Qwen 3.5 وGemma 4 في معظم اختبارات البرمجة الوكيلية رغم صغر حجمه النسبي
النموذج يستخدم تقنية التعلم المعزز لتحسين ذاته عبر تحسين مسارات البحث عن الحلول وليس الحلول فقط
متاح بترخيص MIT دون قيود جغرافية، مع دعم نافذة سياق تصل إلى 256 ألف رمز

أطلق فريق deepreinforce-ai نموذج Ornith-1.0 للبرمجة الوكيلية (Agentic Coding)، وهو نموذج مفتوح المصدر يدّعي تصدُّر المعايير القياسية بين النماذج المفتوحة من فئته. يأتي النموذج بأربعة أحجام مختلفة، ويتميز بآلية تحسين ذاتي تعتمد على التعلم المعزز، مما يجعله قادراً على تعلُّم استراتيجيات حل المشكلات وليس مجرد توليد الأكواد.

ما الذي يميز Ornith-1.0 عن نماذج البرمجة الأخرى؟

الفارق الجوهري يكمن في منهجية التدريب. النماذج التقليدية للبرمجة تتعلم توليد المخرجات (الكود) مباشرةً، بينما يستخدم Ornith-1.0 التعلم المعزز لتحسين عنصرين معاً: الحل النهائي، والسقالة (Scaffold) التي توجّه عملية الوصول إلى ذلك الحل. بعبارة أخرى، النموذج يتعلم كيف يبحث عن الحلول الأفضل، وليس فقط كيف يكتب الكود.

هذه المنهجية تُنتج مسارات بحث أكثر كفاءة، وحلولاً بجودة أعلى وفقاً للفريق المطوّر. وقد بُني النموذج فوق معماريتي Gemma 4 من Google وQwen 3.5 من Alibaba، مع تدريب لاحق متخصص في مهام البرمجة الوكيلية.

ما الأحجام المتاحة وما متطلبات التشغيل؟

يتوفر Ornith-1.0 بأربعة أحجام تغطي سيناريوهات متعددة من التشغيل المحلي إلى البنية التحتية المؤسسية:

Ornith-1.0-9B (كثيف): يعمل على وحدة GPU واحدة بذاكرة 80GB، مناسب للتطوير والضبط الدقيق
Ornith-1.0-31B (كثيف): للخوادم متوسطة الحجم
Ornith-1.0-35B (MoE): نموذج خبراء مختلطين يتطلب توزيع التنسور عبر عدة GPUs
Ornith-1.0-397B (MoE): الحجم الأكبر، منافس مباشر لـ Claude Opus وDeepSeek-V4

جميع النماذج تدعم نافذة سياق بطول 256 ألف رمز (Token)، وتتوافق مع واجهة OpenAI API. كما تتوفر نسخ GGUF المُكمَّمة للتشغيل المحلي عبر llama.cpp أو Ollama، ونسخ FP8 لتقليل استهلاك الذاكرة على البطاقات الداعمة.

كيف يقارن الأداء مع المنافسين؟

تُظهر النتائج المنشورة تفوقاً ملحوظاً في معظم المعايير القياسية. على سبيل المثال، حقق Ornith-1.0-9B نتيجة 43.1% في Terminal-Bench 2.1 مقابل 21.3% لـ Qwen3.5-9B. وفي SWE-bench Verified، سجّل 69.4% متجاوزاً Gemma4-31B الذي حقق 52% رغم كونه أكبر حجماً بثلاث مرات تقريباً.

82.4%

نتيجة Ornith-1.0-397B في SWE-bench Verified، متفوقاً على Claude Opus 4.7 (80.8%) ومقارباً Claude Opus 4.8 (87.6%)

على مستوى النماذج الكبرى، يُنافس Ornith-1.0-397B مباشرةً النماذج المغلقة. في Terminal-Bench 2.1، سجّل 77.5% متفوقاً على DeepSeek-V4-Pro (64%) وClaude Opus 4.7 (70.3%)، لكنه يتأخر عن GLM-5.2-744B (81%) وClaude Opus 4.8 (85%). هذه النتائج تضعه في مصاف أفضل النماذج المفتوحة المصدر حالياً.

ما المعايير القياسية المستخدمة في التقييم؟

اعتمد الفريق على مجموعة شاملة من معايير البرمجة الوكيلية:

Terminal-Bench 2.1: يقيس قدرة النموذج على تنفيذ مهام برمجية عبر الطرفية
SWE-bench (Verified, Pro, Multilingual): محاكاة لبيئة تطوير حقيقية تتضمن التنقل في قواعد أكواد كبيرة
NL2Repo: تحويل وصف بلغة طبيعية إلى مستودع كود كامل
OpenClaw وClawEval: اختبارات على توزيعات مهام من مستخدمين حقيقيين
SWE Atlas: ثلاثة اختبارات فرعية (QnA, RF, TW) لقياس الفهم العميق للأكواد

جميع الاختبارات أُجريت بإعدادات موحدة تشمل temperature=1.0 لإعادة إنتاج النتائج، مع متوسط خمس تشغيلات لكل اختبار لضمان الموثوقية.

ما شروط الترخيص والتوفر؟

يُوزَّع Ornith-1.0 تحت رخصة MIT، وهي من أكثر الرخص تساهلاً في عالم المصادر المفتوحة. تسمح باستخدام تجاري غير مقيد، والتعديل وإعادة التوزيع دون شروط معقدة. والأهم أنه لا توجد قيود جغرافية على الوصول — نقطة جوهرية بالنظر إلى أن بعض النماذج الحديثة (مثل إصدارات معينة من DeepSeek) تفرض قيوداً إقليمية.

ℹ️

رأي Logicity

موقع Ornith-1.0 في السوق مثير للاهتمام: فهو يستهدف الفجوة بين النماذج المفتوحة محدودة القدرات والنماذج المغلقة الباهظة. المنافسون المباشرون يشملون DeepSeek Coder V3 (الذي يتفوق في بعض المهام لكنه يفتقر للترخيص المفتوح الكامل)، وCodeLlama من Meta (أقل تخصصاً في المهام الوكيلية)، وStarCoder2 (أصغر حجماً). للمؤسسات التي تحتاج نموذجاً وكيلياً قابلاً للتشغيل المحلي دون مخاوف ترخيص، يمثل Ornith خياراً جديراً بالاختبار. تكلفة التشغيل الذاتي للنموذج 9B على سحابة AWS/GCP تبدأ من حوالي 2-3 دولارات للساعة على مثيل A100، مقارنةً بتسعير API الخاص بـ Claude أو GPT-4 الذي قد يصل إلى عشرات الدولارات للمهام المعقدة.

كيف يمكن البدء باستخدام النموذج؟

يتطلب التشغيل بيئة حديثة نسبياً: Transformers 5.8.1 أو أحدث، vLLM 0.19.1، أو SGLang 0.5.9. الإعدادات الموصى بها للاستخدام العام هي temperature=0.6 وtop_p=0.95 وtop_k=20، بينما يُستخدم temperature=1.0 لإعادة إنتاج نتائج المعايير المنشورة.

النموذج يعمل بوضع الاستدلال (Reasoning Mode) افتراضياً، حيث يبدأ كل رد بكتلة تفكير داخلية ضمن وسوم <think>...</think> قبل الإجابة النهائية. هذا السلوك مشابه لنماذج o1 من OpenAI، ويسمح بتتبع منطق النموذج عند تصحيح الأخطاء.

الأسئلة الشائعة

هل يمكن تشغيل Ornith-1.0 على حاسوب شخصي؟

نعم، نسخة 9B-GGUF المُكمَّمة تعمل عبر llama.cpp أو Ollama على أجهزة بذاكرة GPU متواضعة (16-24GB)، لكن الأداء سيكون أبطأ من التشغيل على خوادم متخصصة.

ما الفرق بين نماذج Dense وMoE في Ornith؟

النماذج الكثيفة (Dense) تُفعّل جميع المعاملات في كل استدعاء، بينما نماذج خبراء المزيج (MoE) تُفعّل جزءاً فقط مما يجعلها أكثر كفاءة حسابياً عند الحجم الكبير، لكنها تتطلب ذاكرة أكبر لتحميل جميع الخبراء.

هل Ornith-1.0 مناسب للإنتاج التجاري؟

رخصة MIT تسمح بذلك قانونياً دون قيود. لكن كأي نموذج جديد، يُنصح باختباره مكثفاً على حالات الاستخدام الخاصة بك قبل الاعتماد عليه في بيئة إنتاجية.

كيف يقارن Ornith-1.0 مع GitHub Copilot؟

Copilot يعمل كمساعد إكمال أكواد، بينما Ornith مصمم للمهام الوكيلية الأعقد كالتنقل في مستودعات كاملة وتنفيذ تعديلات متعددة الخطوات. هما أدوات مكمّلة أكثر منها متنافسة.

ℹ️

هل تحتاج مساعدة في التطبيق؟

إذا كنت تخطط لدمج Ornith-1.0 في بنيتك التحتية أو تحتاج استشارة حول اختيار الحجم المناسب لحالة استخدامك، تواصل مع فريق Logicity للحصول على توجيه تقني متخصص.