May 30, 2024Open Access

Q-learning comme un schéma monotone

Key Points

Key points are not available for this paper at this time.

Abstract

Les problèmes de stabilité liés aux méthodes d'apprentissage par renforcement persistent. Pour mieux comprendre certains de ces problèmes de stabilité et de convergence impliquant des méthodes d'apprentissage par renforcement profond, nous examinons un exemple quadratique linéaire simple. Nous interprétons le critère de convergence du Q-learning exact dans le sens d'un schéma monotone et discutons des conséquences de l'approximation fonctionnelle sur les propriétés de monotonie.

Q-learning comme un schéma monotone

Key Points

Abstract

Cite This Study

Also Consider

Also Consider