August 12, 2023Open Access

Programmation dynamique différentielle pour les jeux différentiels à somme nulle à horizon fini de systèmes non linéaires

Key Points

Key points are not available for this paper at this time.

Abstract

Résumé Dans cet article, nous présentons un algorithme itératif basé sur la programmation dynamique différentielle (DDP) pour les jeux différentiels à somme nulle à deux personnes à horizon fini. La technique de DDP est utilisée pour développer l'équation différentielle partielle Hamilton–Jacobi–Isaacs (HJI) en équations différentielles d'ordre supérieur. En utilisant des approximations de fonction valeur et de point selle, l'expansion DDP est transformée en équation matricielle algébrique sous forme intégrale. Sur la base de l'équation matricielle algébrique, un algorithme itératif DDP est développé pour apprendre la solution aux jeux différentiels. Une preuve stricte est proposée pour garantir les convergences itératives de la fonction valeur et du point selle. Le nouvel algorithme est fondamentalement différent des résultats existants, en ce sens qu'il surmonte l'obstacle technique pour traiter le comportement variant dans le temps de l'équation différentielle partielle HJI. Des exemples de simulation sont donnés pour démontrer l'efficacité de la méthode proposée.

Programmation dynamique différentielle pour les jeux différentiels à somme nulle à horizon fini de systèmes non linéaires

Key Points

Abstract

Cite This Study