Key points are not available for this paper at this time.
بناء وكلاء مستقلين يمكنهم معالجة كميات هائلة من بيانات الحساسات الملتقطة في الوقت الحقيقي أمر أساسي للكثير من التطبيقات في العالم الحقيقي بما في ذلك السيارات المستقلة، والروبوتات، والذكاء الاصطناعي في الطب. بما أن الوكيل يحتاج غالبًا إلى الاستكشاف في بيئة ديناميكية، فإن تمكين الوكيل من التعلم مع مرور الوقت دون تدهور في الأداء هو هدف مرغوب ولكنه يواجه تحديات. يهدف التعلم المستمر إلى بناء متعلم مستمر يمكنه تعلم مفاهيم جديدة على طول تدفق البيانات بينما يحتفظ بالمفاهيم التي تم تعلمها سابقًا. في الحديث، سأستعرض ثلاث قطع من أبحاثي الأخيرة حول التعلم المستمر: (1) التعلم المستمر تحت الإشراف، (2) التعلم المستمر غير المراقب، و(3) التعلم المستمر متعدد الأنماط. في العمل الأول، سأناقش خوارزمية التعلم المستمر تحت الإشراف المعروفة باسم MEGA التي توازن ديناميكيًا بين المهام القديمة والمهام الجديدة. في العمل الثاني، سأناقش خوارزميات التعلم المستمر غير المراقب التي تتعلم التمثيل باستمرار دون الوصول إلى التسميات. في العمل الثالث، سأوضح خوارزمية فعالة للتعلم المستمر يمكنها تعلم أنماط متعددة باستمرار دون نسيان.
درس يونهوي قوه (سون) هذا السؤال.