التقليد هو آلية تعلم أساسية لدى البشر، تتيح للأفراد تعلم مهام جديدة من خلال ملاحظة وتقليد الخبراء. ومع ذلك، فإن تطبيق هذه القدرة على الروبوتات يمثل تحديات كبيرة بسبب الاختلافات الجوهرية بين تجسيد البشر والروبوتات في كل من مظهرها البصري وقدراتها الجسدية. بينما تستخدم الطرق السابقة مجموعات بيانات عبر التجسيد لتقليل هذه الفجوة مع مشاهد ومهام مشتركة، فإن جمع هذه البيانات المتناسقة بين البشر والروبوتات على نطاق واسع ليس بالأمر السهل. في هذا البحث، نقترح UniSkill، إطار عمل جديد يتعلم تمثيلات المهارات غير المعتمدة على التجسيد من بيانات الفيديو عبر التجسيد على نطاق واسع دون أي تسميات، مما يتيح نقل المهارات المستخرجة من ملاحظات الفيديو البشرية بفاعلية إلى سياسات روبوتية تم تدريبها فقط على بيانات الروبوتات. تظهر تجاربنا في بيئات المحاكاة والعالم الحقيقي أن مهاراتنا عبر التجسيد توجيه الروبوتات بنجاح لاختيار الإجراءات المناسبة، حتى مع ملاحظات الفيديو غير المرئية. يمكن العثور على موقع المشروع على: https://kimhanjung.github.io/UniSkill.
درس كيم وزملاؤه (الثلاثاء) هذا السؤال.