December 27, 2019

Optimale Stabilisierung auf Basis von Reinforcement Learning für unbekannte nichtlineare Systeme, die Eingaben mit unsicheren Einschränkungen unterliegen

Key Points

Key points are not available for this paper at this time.

Abstract

Dieser Artikel präsentiert eine neuartige Reinforcement-Learning-Strategie, die ein optimales Stabilisationsproblem für unbekannte nichtlineare Systeme behandelt, die unsicheren Eingabebeschränkungen unterliegen. Der Steueralgorithmus besteht aus zwei Teilen, d.h. optimales Online-Lernsteuerung für das nominale System und Feedforward-Neuronale-Netze (NNs) zur Kompensation der unsicheren Eingabebeschränkungen, die als Sättigungsnichtlinearitäten betrachtet werden. Durch die Integration der Eingangs-Ausgangsdaten und eines rekurrenten NNs wird ein Luenberger-Beobachter etabliert, um die unbekannte Systemdynamik zu approximieren. Für nominale Systeme ohne Eingabebeschränkungen wird die Online-Lern-Optimalsteuerungspolitik abgeleitet, indem die Hamilton-Jacobi-Bellman-Gleichung allein über ein Kritiker-NN gelöst wird. Durch die Transformation der unsicheren Eingabebeschränkungen in Sättigungsnichtlinearitäten können die unsicheren Eingabebeschränkungen durch den Einsatz eines Feedforward-NN-Kompensators kompensiert werden. Die Konvergenz des geschlossenen Regelkreissystems wird durch die Verwendung der Lyapunov-Stabilitätsanalyse gewährleistet, dass sie gleichmäßig letztendlich begrenzt ist. Schließlich wird die Wirksamkeit des entwickelten Stabilisierungsschemas durch Simulationen veranschaulicht.

KI fragen

Bookmark