August 26, 2024Open Access

جسر الفجوة بين التعلم للتخطيط، والحركات الأساسية، والتعلم التعزيزي الآمن

Key Points

Key points are not available for this paper at this time.

Abstract

تخطيط المسار تحت قيود الحركية الديناميكية أساسي لتطبيقات الروبوتات المتقدمة التي تتطلب مهارات دقيقة وسريعة ومتفاعلة في بيئات معقدة. تمثل هذه القيود، التي قد تعكس مهامًا أو سلامة أو حدود المحركات، ضروريًا لضمان التشغيل السليم لمنصات الروبوت ومنع السلوكيات غير المتوقعة. تظهر التطورات الحديثة في تخطيط الحركية الديناميكية أن تقنيات التعلم للتخطيط يمكن أن تولد حركات معقدة وتفاعلية تحت قيود دقيقة. ومع ذلك، تتطلب هذه التقنيات نمذجة تحليلية لكل من الروبوت والمهمة بأكملها، وهو فرض مقيد عندما تكون الأنظمة معقدة للغاية أو عندما يكون بناء نماذج دقيقة للمهمة أمرًا صعبًا. يعالج هذا البحث هذا القيد من خلال دمج طرق التعلم للتخطيط مع التعلم التعزيزي، مما يؤدي إلى تكامل جديد بين التعلم بالعلب السوداء للحركات الأساسية والتحسين. نقيم طريقتنا مقابل أحدث طرق التعلم التعزيزي الآمن، ونظهر أن تقنيتنا، خاصة عند استغلال هيكل المهمة، تتفوق على الطرق الأساسية في سيناريوهات تحدي مثل التخطيط لضرب في هوكي الهواء الروبوتي. يبرهن هذا العمل على إمكانيات نهجنا المتكامل لتعزيز أداء وسلامة الروبوتات التي تعمل تحت قيود حركية ديناميكية معقدة.

جسر الفجوة بين التعلم للتخطيط، والحركات الأساسية، والتعلم التعزيزي الآمن

Key Points

Abstract

Cite This Study