March 4, 2024Open Access

Tsallis-Entropie-Regularisierung für linear lösbare MDP und lineare quadratische Regler

Key Points

Key points are not available for this paper at this time.

Abstract

Die Shannon-Entropie-Regularisierung wird in der optimalen Steuerung weit verbreitet eingesetzt, da sie die Erkundung fördert und die Robustheit erhöht, z. B. bei der maximalen Entropie verstärkendem Lernen, bekannt als Soft Actor-Critic. In diesem Papier wird die Tsallis-Entropie, die eine einparametrige Erweiterung der Shannon-Entropie darstellt, zur Regularisierung von linear lösbaren MDP und linearen quadratischen Reglern verwendet. Wir leiten die Lösung für diese Probleme ab und demonstrieren deren Nützlichkeit beim Ausbalancieren zwischen Erkundung und Sparsamkeit des erhaltenen Steuerungsgesetzes.

Tsallis-Entropie-Regularisierung für linear lösbare MDP und lineare quadratische Regler

Key Points

Abstract

Cite This Study

Also Consider

Also Consider