Key points are not available for this paper at this time.
Gegebenenfalls zu einem rabattierten Kosten analysieren wir deterministische diskrete Zeitsysteme, deren Eingaben durch Politikiteration (PI) generiert werden. Wir bieten neuartige nahezu Optimalitäts- und Stabilitätseigenschaften, während wir nicht stabilisierende Anfangspolitiken zulassen. Das heißt, zunächst geben wir neuartige Schranken für die Diskrepanz zwischen der durch PI generierten Wertfunktion und der optimalen Wertfunktion an, die im Allgemeinen weniger konservativ sind als die in der dynamischen Programmierungsliteratur für die betrachtete Klasse von Systemen. Dann zeigen wir, dass das System im geschlossenen Regelkreis mit durch PI generierten Politiken unter milden Bedingungen stabilisierend ist, nach einer endlichen (und bekannten) Anzahl von Iterationen.
Brusse et al. (Mon,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: