Key points are not available for this paper at this time.
بالنسبة للبشر والروبوتات على حد سواء، يعتبر الحس باللمس، المعروف باسم الاستشعار اللمسي، أمرًا حاسمًا لأداء مهام التلاعب الغنية بالاتصال. التحديات الثلاثة الرئيسية في الاستشعار اللمسي الروبوتي هي: 1) تفسير إشارات المستشعر، 2) توليد إشارات المستشعر في سيناريوهات جديدة، و3) تعلم السياسات المعتمدة على المستشعر. بالنسبة للمستشعرات اللمسية البصرية، تم تسهيل التفسير بسبب علاقتها الوثيقة مع مستشعرات الرؤية (مثل كاميرات RGB). ومع ذلك، لا يزال التوليد صعبًا، حيث تتضمن المستشعرات اللمسية البصرية عادةً الاتصال، والتشوه، والإضاءة، والتصوير، وكلها مكلفة في المحاكاة؛ ومن ثم، كان تعلم السياسة تحديًا، حيث لا يمكن الاستفادة من المحاكاة لجمع البيانات على نطاق واسع. نقدم TacSL (تاكسل)، مكتبة لمحاكاة وتعلم المستشعرات اللمسية البصرية باستخدام وحدة معالجة الرسوميات (GPU). يمكن استخدام TacSL لمحاكاة الصور اللمسية البصرية واستخراج توزيعات قوة الاتصال بسرعة تزيد عن 200 مرة مقارنة بالحالة السابقة للأفضل، وكل ذلك داخل جهاز المحاكاة الشائع الاستخدام Isaac Gym. علاوة على ذلك، توفر TacSL مجموعة أدوات تعليمية تحتوي على نماذج مستشعر متعددة، وبيئات تدريب غنية بالاتصال، وخوارزميات عبر الإنترنت/خارجة عن الإنترنت يمكن أن تسهل تعلم السياسات للتطبيقات من المحاكاة إلى الواقع. من الناحية الخوارزمية، نقدم خوارزمية جديدة للتعلم التعزيزي عبر الإنترنت تُعرف باسم التقطير غير المتناظر للاعب-الناقد، تهدف إلى تعلم السياسات المعتمدة على اللمس بشكل فعال وفعال في المحاكاة التي يمكن نقلها إلى العالم الحقيقي. أخيرًا، نوضح فائدة مكتبتنا وخوارزمياتنا من خلال تقييم فوائد التقطير والاستشعار المتعدد النماذج لمهام التلاعب الغنية بالاتصال، والأهم من ذلك، إجراء النقل من المحاكاة إلى الواقع. الفيديوهات والنتائج التكميلية متاحة في https://iakinola23.github.io/tacsl/.
أكينولا وآخرون (الإثنين) درسوا هذا السؤال.