Key points are not available for this paper at this time.
تطوير روبوتات قادرة على مهارات التلاعب الدقيقة أمر في غاية الأهمية لبناء روبوتات مساعدة حقيقية. تحتاج هذه الروبوتات إلى أن تكون مطاوعة في تحريكها والتحكم فيها من أجل العمل بأمان في البيئات البشرية. تتضمن مهام التManipulation تفاعلات اتصال معقدة مع العالم الخارجي، وتنطوي على تفكير حول القوى والعزوم التي يجب تطبيقها. يُعَد التخطيط في ظل ظروف الاتصال عمومًا غير عملي بسبب التعقيد الحسابي، ونقص نماذج الديناميكا الدقيقة للبيئة. نقدم نهجًا لاكتساب مهارات التلاعب على الروبوتات المطاوعة من خلال التعلم المدعوم. يتم تهيئة سياسة التحكم في الوضع الابتدائي للتلاعب من خلال العرض الحركي. نقوم بتعزيز هذه السياسة بملف قوة/عزم للتحكم به بالاشتراك مع مسارات الوضع. نستخدم خوارزمية تحسين السياسة مع تكامل المسار (PI 2) لتعلم هذه الملفات من القوة/العزم عن طريق تحسين دالة التكلفة التي تقيس نجاح المهمة. نحن نستعرض نهجنا على ذراع الروبوت بارّيت وام المزود بجهاز استشعار القوة/العزم ذو 6 درجات حرية في مهمتين مختلفتين للتلاعب: فتح باب بمقابض الباب الرافعة، ورفع قلم من على الطاولة. نحن نظهر أن سياسات التحكم في القوة التي تم تعلمها تسمح بتنفيذ المهام بنجاح وبشكل موثوق.
قام كالاكريشنان وآخرون (الخميس) بدراسة هذا السؤال.