March 25, 2024Open Access

هندسة مدار التغذية الراجعة الناتجة: manifolds النسبة وتحسين السياسة المباشر LQG

Key Points

Key points are not available for this paper at this time.

Abstract

ننظر في تحسين السياسة المباشر لإعداد Gaussian الخطي-التربيعي (LQG). على مدار السنوات القليلة الماضية، تم التعرف على أن منظر متحكمات التغذية الراجعة الديناميكية ذات الصلة بـ LQG له هندسة معقدة، تتعلق بشكل خاص بوجود نقاط مستقرة متدهورة، مما يعيق طرق التدرج. لمعالجة هذه التحديات، في هذه الورقة، نعتمد مقياس ريمااني غير قابل للتغيير في النظام لمكان متحكمات التغذية الراجعة الديناميكية ونطور أسلوب نزول التدرج ريمااني لتحسين السياسة المباشرة لـ LQG. ثم نثبت أن فضاء المدار لهذه المتحكمات، مع الأخذ في الاعتبار تحويل الإحداثيات، يقبل هيكل مانيفولد ريمااني. توفر هذه البنية الهندسية - التي لها اهتمام مستقل - نهجاً فعالاً لاستنتاج خوارزميات تحسين السياسة المباشرة لـ LQG مع ضمان معدل تقارب خطي محلي. بعد ذلك، نوضح أن النهج المقترح يظهر أداءً عدديًا أسرع وأكثر موثوقية مقارنة بنزول التدرج العادي.

هندسة مدار التغذية الراجعة الناتجة: manifolds النسبة وتحسين السياسة المباشر LQG

Key Points

Abstract

Cite This Study