Key points are not available for this paper at this time.
يعد التلاعب غير القابض ضروريًا للتعامل مع الكائنات التي تكون رقيقة جدًا أو كبيرة أو غير قابلة للإمساك بها بطريقة أخرى في الطبيعة. لتجنب صعوبة نمذجة الاتصال في الأساليب التقليدية المعتمدة على النمذجة، برز التعلم التعزيزي مؤخرًا كبديل واعد. ومع ذلك، فإن الأساليب السابقة في التعلم التعزيزي إما تفتقر إلى القدرة على التعميم على أشكال الكائنات المتنوعة، أو تستخدم بدائل بسيطة للإجراءات تحد من تنوع حركات الروبوت. علاوة على ذلك، فإن استخدام التعلم التعزيزي على هندسة الأجسام المتنوعة يمثل تحديًا بسبب التكلفة العالية لتدريب سياسة تأخذ مدخلات حسية ذات أبعاد عالية. نقترح تمثيلًا جديدًا يعتمد على الاتصال وخط أنابيب مسبق التدريب لمعالجة هذه القضية. لتمكين التدريب المتوازي على نطاق واسع، نستفيد من بنية المحول المعتمدة على التصحيحات الخفيفة لمشفّرنا الذي يعالج سحب النقاط، مما يتيح توسيع تدريبنا عبر آلاف البيئات. مقارنة بالتعلم من الصفر، أو غيرها من الأسس لتمثيل الأشكال، يسهل تمثيلنا التعلم بكفاءة من حيث الوقت والبيانات. نتحقق من فعالية نظامنا العام من خلال نقل السياسة المدربة إلى كائنات جديدة في العالم الحقيقي بدون إعداد مسبق. الكود ومقاطع الفيديو متاحة على https://sites.google.com/view/contact-non-prehensile.
درس تشو وآخرون (يوم الجمعة) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: