Key points are not available for this paper at this time.
Die Shannon-Entropie-Regularisierung wird in der optimalen Steuerung weit verbreitet eingesetzt, da sie die Erkundung fördert und die Robustheit erhöht, z. B. bei der maximalen Entropie verstärkendem Lernen, bekannt als Soft Actor-Critic. In diesem Papier wird die Tsallis-Entropie, die eine einparametrige Erweiterung der Shannon-Entropie darstellt, zur Regularisierung von linear lösbaren MDP und linearen quadratischen Reglern verwendet. Wir leiten die Lösung für diese Probleme ab und demonstrieren deren Nützlichkeit beim Ausbalancieren zwischen Erkundung und Sparsamkeit des erhaltenen Steuerungsgesetzes.
Hashizume et al. (Mon,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: