Key points are not available for this paper at this time.
Dieser Artikel präsentiert eine neuartige Reinforcement-Learning-Strategie, die ein optimales Stabilisationsproblem für unbekannte nichtlineare Systeme behandelt, die unsicheren Eingabebeschränkungen unterliegen. Der Steueralgorithmus besteht aus zwei Teilen, d.h. optimales Online-Lernsteuerung für das nominale System und Feedforward-Neuronale-Netze (NNs) zur Kompensation der unsicheren Eingabebeschränkungen, die als Sättigungsnichtlinearitäten betrachtet werden. Durch die Integration der Eingangs-Ausgangsdaten und eines rekurrenten NNs wird ein Luenberger-Beobachter etabliert, um die unbekannte Systemdynamik zu approximieren. Für nominale Systeme ohne Eingabebeschränkungen wird die Online-Lern-Optimalsteuerungspolitik abgeleitet, indem die Hamilton-Jacobi-Bellman-Gleichung allein über ein Kritiker-NN gelöst wird. Durch die Transformation der unsicheren Eingabebeschränkungen in Sättigungsnichtlinearitäten können die unsicheren Eingabebeschränkungen durch den Einsatz eines Feedforward-NN-Kompensators kompensiert werden. Die Konvergenz des geschlossenen Regelkreissystems wird durch die Verwendung der Lyapunov-Stabilitätsanalyse gewährleistet, dass sie gleichmäßig letztendlich begrenzt ist. Schließlich wird die Wirksamkeit des entwickelten Stabilisierungsschemas durch Simulationen veranschaulicht.
Zhao et al. (Fr,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: