Key points are not available for this paper at this time.
ننظر في تحسين السياسة المباشر لإعداد Gaussian الخطي-التربيعي (LQG). على مدار السنوات القليلة الماضية، تم التعرف على أن منظر متحكمات التغذية الراجعة الديناميكية ذات الصلة بـ LQG له هندسة معقدة، تتعلق بشكل خاص بوجود نقاط مستقرة متدهورة، مما يعيق طرق التدرج. لمعالجة هذه التحديات، في هذه الورقة، نعتمد مقياس ريمااني غير قابل للتغيير في النظام لمكان متحكمات التغذية الراجعة الديناميكية ونطور أسلوب نزول التدرج ريمااني لتحسين السياسة المباشرة لـ LQG. ثم نثبت أن فضاء المدار لهذه المتحكمات، مع الأخذ في الاعتبار تحويل الإحداثيات، يقبل هيكل مانيفولد ريمااني. توفر هذه البنية الهندسية - التي لها اهتمام مستقل - نهجاً فعالاً لاستنتاج خوارزميات تحسين السياسة المباشرة لـ LQG مع ضمان معدل تقارب خطي محلي. بعد ذلك، نوضح أن النهج المقترح يظهر أداءً عدديًا أسرع وأكثر موثوقية مقارنة بنزول التدرج العادي.
درس كرايسلر وزملاؤه (مون،) هذا السؤال.