Key points are not available for this paper at this time.
Résumé Dans cet article, nous présentons une nouvelle approche du problème d'apprentissage des primitives motrices, qui combine des idées de généralisation statistique et d'apprentissage par erreur. La procédure d'apprentissage est formulée en deux étapes. La première étape est basée sur la généralisation des mouvements précédemment entraînés associés à une configuration de tâche spécifique, ce qui entraîne une première approximation d'une politique de contrôle adaptée dans une nouvelle situation. La deuxième étape applique l'apprentissage dans le sous-espace défini par les données d'entraînement acquises précédemment, ce qui entraîne un problème d'apprentissage dans un domaine contraint. Nous montrons que l'apprentissage par renforcement dans un domaine contraint peut être interprété comme un algorithme d'apprentissage par erreur. De plus, nous proposons des modifications pour accélérer le processus d'apprentissage. L'approche proposée a été testée à la fois en simulation et expérimentalement sur deux tâches difficiles : l'apprentissage du retournement de boîte d'allumettes et du versement.
Nemec et al. (Tue,) ont étudié cette question.