AI & Machine Learning

أسطول روبوتات Nvidia يُدرِّب نفسه ذاتياً عبر وكلاء برمجة بالذكاء الاصطناعي

عمر حسن18 June 2026 at 6:51 am6 دقيقة للقراءة

أبرز النقاط

نظام ENPIRE يحوّل مختبر الروبوتات إلى خط إنتاج برمجي ذاتي التحسين يعمل طوال الليل دون إشراف بشري
أسطول من 8 روبوتات حقق نسبة نجاح 99% في مهام دقيقة كإدخال الدبابيس وقص الأربطة البلاستيكية
الوكلاء البرمجيون يتشاركون الاكتشافات عبر Git، فينتشر أي اختراق في محطة واحدة إلى الأسطول بأكمله

نجحت Nvidia بالتعاون مع جامعتي Carnegie Mellon وUC Berkeley في تحويل مختبر روبوتات إلى منظومة ذاتية التحسين، حيث تُدرِّب روبوتات ذاتية التدريب نفسها على مهام معقدة دون الحاجة إلى إشراف بشري مستمر. أسطول من ثماني محطات روبوتية حقق نسبة نجاح تصل إلى 99% في مهام تتطلب براعة يدوية فائقة، مثل إدخال دبابيس دقيقة وقص أربطة بلاستيكية، وذلك بفضل نظام جديد يُدعى ENPIRE يعتمد على وكلاء برمجة بالذكاء الاصطناعي.

ما المشكلة التي يحلها نظام ENPIRE؟

تدريب الروبوتات على الإمساك الدقيق والتلاعب بالأشياء يظل من أصعب التحديات في مجال الروبوتات. السبب ليس تقنياً بحتاً، بل بشري: يحتاج المهندسون إلى جمع بيانات التدريب يدوياً، وإعادة ترتيب المشهد بعد كل محاولة، وتعديل الخوارزميات باستمرار. هذا العبء اليدوي يُبطئ البحث بشكل كبير ويجعل التوسع مكلفاً.

يكسر نظام ENPIRE هذا الاختناق بتسليم العمل بالكامل لوكلاء ذكاء اصطناعي برمجيين. الفكرة الجوهرية هي حلقة تغذية راجعة تعمل على عتاد حقيقي: إعادة ضبط مساحة العمل، تنفيذ استراتيجية، فحص النتيجة، ثم تحسين المحاولة التالية — كل ذلك آلياً.

99%

نسبة النجاح التي حققها أسطول ENPIRE في مهام التلاعب الدقيق المعقدة

كيف يبني الوكيل أدوات تقييمه بنفسه؟

يعمل ENPIRE على مرحلتين. في الأولى، يُنشئ الوكيل بيئة عمل متكاملة مع قدر ضئيل من التوجيه البشري: حدود أمان، آلية إعادة ضبط تلقائية، وفحص نجاح آلي. بدلاً من أن يُقيّم إنسان كل محاولة، يكتب الوكيل دالة مكافأة خاصة به للتمييز بين النجاح والفشل، مستنداً فقط إلى دقائق معدودة من مقاطع فيديو توضيحية.

لمهمة إدخال دبوس، مثلاً، طوّر الوكيل آلية فحص تجمع بين المحاذاة البصرية وارتفاع القابض والقوة المُقدَّرة. أما لإغلاق ربطة بلاستيكية، فقد دمج زاويتي كاميرا لتفادي الإيجابيات الكاذبة، وخفّض زمن الاستجابة إلى أقل من 150 ميلي ثانية. هذه الأدوات تُبنى مرة واحدة ثم تُعاد استخدامها دون تعديل.

روبوت ENPIRE يؤدي مهمة إدخال دقيقة باستخدام ذراعين آليتين

ماذا يحدث في المرحلة الثانية؟

في المرحلة الثانية، يعمل الوكيل باستقلالية تامة. يقرأ أوراقاً بحثية، يُشكّل فرضيات، ويُعدّل كود التدريب مباشرة. يستخدم أساليب مثل الاستنساخ السلوكي — حيث تُقلّد الاستراتيجية العروض البشرية — أو التعلم المعزز الذي يتحسن بالتجربة والخطأ. يختار الوكيل الأسلوب بنفسه بناءً على إشارات النجاح الفعلية من العالم الحقيقي.

كيف يتنسق أسطول الروبوتات عبر Git؟

يتوسع ENPIRE ليشمل أسطولاً كاملاً: ثماني محطات روبوت YAM ثنائية الذراع، لكل منها عتادها وحاسوبها ووكيلها البرمجي الخاص. تختبر الوكلاء فرضيات مختلفة بالتوازي وتتشارك النتائج فقط عبر Git، أداة التحكم في الإصدارات المعيارية للبرمجيات.

تتبنى الوكلاء وصفات التدريب الناجحة من بعضها البعض وتتخلى عن الأفكار الفاشلة تلقائياً. أي اختراق يُكتشف في محطة واحدة ينتشر عبر الأسطول بأكمله. هذا النموذج يُحوّل المختبر الفيزيائي إلى خط إنتاج برمجي تقليدي.

8

محطات روبوتية تعمل بالتوازي وتتشارك الاكتشافات عبر Git

ما النتائج التي حققها النظام؟

حققت الوكلاء نسبة نجاح تصل إلى 99% في مهام صعبة مثل اختبار Push-T — حيث يجب على الروبوت تحريك قطعة بشكل حرف T إلى موضع واتجاه محددين — وفرز الدبابيس في صندوق، وقص ربطة بلاستيكية بقاطع. لمهمة إدخال الدبوس، وصلت الاستراتيجية إلى نجاح 100% أسرع من الطرق التقليدية التي تتطلب تدخلاً بشرياً مستمراً.

اختبار Push-T: انخفض الوقت اللازم للنجاح الكامل من 5 ساعات مع روبوت واحد إلى ساعتين فقط مع 8 روبوتات
إدخال الدبوس: انخفض من أكثر من 90 دقيقة إلى نحو 40 دقيقة
تجربة نقل المهارات: ساعدت خبرة إدخال الدبابيس الوكلاء على تركيب وحدات GPU في لوحات أم

اختبر الباحثون ثلاثة وكلاء برمجة: Codex مع GPT-5.5، وClaude Code مع Opus 4.7، وKimi Code مع Kimi K2.6. تفوّق Codex في معظم الحالات.

مقارنة أداء وكلاء البرمجة المختلفة في نظام ENPIRE

لماذا يظل العالم الحقيقي أصعب من المحاكاة؟

كشفت النتائج أن العالم الحقيقي يظل أصعب بكثير من المحاكاة. في اختبار Push-T، نجحت جميع الوكلاء الثلاثة في المحاكاة، لكن اثنين من ثلاثة فشلا في البيئة الحقيقية. يُرجع الباحثون ذلك إلى ظروف غير متوقعة ومتغيرة كديناميكيات الروبوت والاحتكاك وحركة الأشياء.

في محاكاة RoboCasa، تفوّق ENPIRE على نموذج رؤية-لغة-فعل شامل من نوع GR00T ونهج قائم على الأدوات دون بحث تلقائي من نوع CaP-X.

ما القيود المعترف بها؟

الدراسة صريحة بشأن حدودها. لا يُستغل العتاد والحوسبة بالكامل لأن الوكلاء يقضون وقتاً طويلاً في قراءة السجلات وكتابة الكود والانتظار. كلما زاد عدد الروبوتات في الأسطول، انخفض معدل استخدام كل روبوت لأن الوكلاء يقضون وقتاً أطول في تلخيص نتائج بعضهم البعض.

تكاليف الرموز اللغوية تنمو أيضاً أسرع من مكاسب الأداء: الأساطيل الأكبر تصل إلى الهدف أسرع لكنها تستهلك ميزانية حوسبة أكبر بكثير. ومع ذلك، يرى الباحثون أن ENPIRE يمثل مساراً عملياً نحو روبوتات قادرة على التحسن ذاتياً في العالم الحقيقي.

ℹ️

رأي Logicity

ما يجعل ENPIRE مهماً ليس نسبة النجاح وحدها، بل تحويل البحث الروبوتي من مشكلة عتادية إلى مشكلة هندسة برمجيات. هذا النموذج يُمكن أن يُسرّع بشكل جذري تطوير الروبوتات الصناعية في منطقة الخليج، خاصة مع توجه السعودية والإمارات نحو أتمتة المصانع ضمن رؤى التحول الاقتصادي. القدرة على تشغيل أبحاث روبوتية طوال الليل دون فريق بشري تُغيّر اقتصاديات المجال بالكامل.

الأسئلة الشائعة

ما هو نظام ENPIRE من Nvidia؟

ENPIRE هو إطار عمل بحثي يُمكّن وكلاء ذكاء اصطناعي برمجيين من إجراء أبحاث روبوتية ذاتياً على عتاد حقيقي، بما في ذلك إعادة ضبط المشهد وتصميم المكافآت وتعديل الخوارزميات دون تدخل بشري مستمر.

كيف تتشارك الروبوتات الاكتشافات في ENPIRE؟

تستخدم الوكلاء البرمجية أداة Git للتحكم في الإصدارات لمشاركة النتائج. أي استراتيجية ناجحة تُكتشف في محطة واحدة تنتشر تلقائياً عبر الأسطول بأكمله.

ما الفرق بين أداء ENPIRE في المحاكاة والواقع؟

أظهرت التجارب أن العالم الحقيقي أصعب بكثير من المحاكاة. في اختبار Push-T، نجحت جميع الوكلاء في المحاكاة لكن اثنين من ثلاثة فشلا في البيئة الحقيقية بسبب متغيرات كالاحتكاك وديناميكيات الروبوت.

ما التطبيقات المحتملة لهذه التقنية في الخليج؟

يمكن أن تُسرّع هذه التقنية أتمتة المصانع والمستودعات في دول الخليج، وتدعم مشاريع التحول الصناعي ضمن رؤية السعودية 2030 واستراتيجية الإمارات للثورة الصناعية الرابعة.

ℹ️

هل تحتاج مساعدة في التطبيق؟

إذا كنت تستكشف دمج الروبوتات الذكية أو أنظمة التدريب الذاتي في منشأتك، تواصل مع فريق Logicity للحصول على استشارة متخصصة حول أحدث حلول الأتمتة المناسبة لسوق الخليج.