Key points are not available for this paper at this time.
نحن نتناول مشكلة تمكين الروبوتات الرباعية الأرجل من أداء مهارات التسديد الدقيقة في العالم الحقيقي باستخدام التعلم التعزيزي. إن تطوير خوارزميات لتمكين روبوت ذو أرجل من تسديد كرة القدم إلى هدف معين يُعتبر مشكلة تحدي تجمع بين التحكم في حركة الروبوت والتخطيط في مهمة واحدة. لحل هذه المشكلة، نحتاج إلى مراعاة القيود الديناميكية وثبات الحركة أثناء التحكم في روبوت ديناميكي ذي أرجل. علاوة على ذلك، نحتاج إلى مراعاة التخطيط الحركي لتسديد الكرة القابلة للتشوه والتي يصعب نمذجتها والمتدحرجة على الأرض مع احتكاك غير مؤكد إلى موقع مرغوب. في هذه الورقة، نقترح إطارًا هرميًا يستفيد من التعلم التعزيزي العميق لتدريب (أ) سياسة تحكم في الحركة قوية يمكنها تتبع الحركات العشوائية و(ب) سياسة تخطيط لتحديد الحركة المرغوبة للتسديد على كرة القدم نحو هدف. نقوم بنشر الإطار المقترح على روبوت رباعي الأرجل A1 ونمكنه من تسديد الكرة بدقة نحو أهداف عشوائية في العالم الحقيقي.
درس جي وآخرون (سون) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: