December 16, 2024Open Access

Politikiteration für diskrete Zeitsysteme mit rabattierten Kosten: Stabilitäts- und nahezu Optimalitätsgarantien

Key Points

Key points are not available for this paper at this time.

Abstract

Gegebenenfalls zu einem rabattierten Kosten analysieren wir deterministische diskrete Zeitsysteme, deren Eingaben durch Politikiteration (PI) generiert werden. Wir bieten neuartige nahezu Optimalitäts- und Stabilitätseigenschaften, während wir nicht stabilisierende Anfangspolitiken zulassen. Das heißt, zunächst geben wir neuartige Schranken für die Diskrepanz zwischen der durch PI generierten Wertfunktion und der optimalen Wertfunktion an, die im Allgemeinen weniger konservativ sind als die in der dynamischen Programmierungsliteratur für die betrachtete Klasse von Systemen. Dann zeigen wir, dass das System im geschlossenen Regelkreis mit durch PI generierten Politiken unter milden Bedingungen stabilisierend ist, nach einer endlichen (und bekannten) Anzahl von Iterationen.

Read Full Paperexternally

KI fragen

Bookmark

View Full Paper