Key points are not available for this paper at this time.
Résumé Dans cet article, nous présentons un algorithme itératif basé sur la programmation dynamique différentielle (DDP) pour les jeux différentiels à somme nulle à deux personnes à horizon fini. La technique de DDP est utilisée pour développer l'équation différentielle partielle Hamilton–Jacobi–Isaacs (HJI) en équations différentielles d'ordre supérieur. En utilisant des approximations de fonction valeur et de point selle, l'expansion DDP est transformée en équation matricielle algébrique sous forme intégrale. Sur la base de l'équation matricielle algébrique, un algorithme itératif DDP est développé pour apprendre la solution aux jeux différentiels. Une preuve stricte est proposée pour garantir les convergences itératives de la fonction valeur et du point selle. Le nouvel algorithme est fondamentalement différent des résultats existants, en ce sens qu'il surmonte l'obstacle technique pour traiter le comportement variant dans le temps de l'équation différentielle partielle HJI. Des exemples de simulation sont donnés pour démontrer l'efficacité de la méthode proposée.
Zhang et al. (Sat,) ont étudié cette question.