Key points are not available for this paper at this time.
تعلم الروبوتات متعددة المهام يحمل أهمية كبيرة في التعامل مع سيناريوهات متنوعة ومعقدة. ومع ذلك، فإن الأساليب الحالية تعاني من مشاكل في الأداء وصعوبات في جمع مجموعات بيانات التدريب. في هذه الورقة، نقترح GeRM (النموذج الروبوتي العام). نستخدم التعلم المعزز غير المتصل لتحسين استراتيجيات استخدام البيانات للتعلم من كل من العروض والبيانات دون المثلى، وبالتالي تجاوز قيود العروض البشرية. بعد ذلك، نستخدم شبكة تعتمد على المحولات لمعالجة المدخلات متعددة الأنماط وإخراج الإجراءات. من خلال تقديم هيكل خليط الخبراء، فإن GeRM يسمح بسرعة استنتاج أسرع مع قدرة نموذج كاملة أعلى، وبالتالي يحل مشكلة محدودية معلمات التعلم المعزز، مما يعزز أداء النموذج في تعلم المهام المتعددة مع التحكم في تكاليف الحوسبة. من خلال سلسلة من التجارب، نوضح أن GeRM يتفوق على طرق أخرى عبر جميع المهام، بينما نتحقق أيضًا من كفاءته في كل من عمليات التدريب والاستنتاج. بالإضافة إلى ذلك، نكشف عن إمكانيته في اكتساب المهارات الناشئة. كما أننا نقدم مجموعة بيانات QUARD-Auto، التي تم جمعها تلقائيًا لدعم اقترابنا التدريبي وتعزيز التقدم في تعلم الروبوتات الرباعية المهام المتعددة. تقدم هذه الورقة نموذجًا جديدًا لتقليل تكلفة جمع بيانات الروبوت ودفع التقدم في مجتمع التعلم متعدد المهام.
قام سونغ وآخرون (الأربعاء) بدراسة هذا السؤال.