What question did this study set out to answer?

Cette recherche vise à développer une méthode d'apprentissage d'une politique pouvant généraliser à divers tâches dans des applications robotiques.

May 1, 2014

Recherche de politiques multitâches pour la robotique

Key Points

Cette recherche vise à développer une méthode d'apprentissage d'une politique pouvant généraliser à divers tâches dans des applications robotiques.
Introduction d'une politique de retour non linéaire définie comme une fonction de l'état et de la tâche.
Application de l'approche à l'apprentissage par renforcement et à l'apprentissage par imitation dans des expériences avec des robots réels.
Réalisation d'une généralisation efficace des tâches à travers des tâches connues et inconnues.
Démonstration de l'application réussie de la nouvelle politique dans des scénarios avec des robots réels.

Abstract

Apprendre des politiques qui se généralisent à travers plusieurs tâches est un sujet de recherche important et difficile dans l'apprentissage par renforcement et la robotique. Former des politiques individuelles pour chaque tâche potentielle est souvent impratique, surtout pour les variations de tâches continues, nécessitant des approches plus fondées pour partager et transférer des connaissances entre des tâches similaires. Nous présentons une approche novatrice pour apprendre une politique de rétroaction non linéaire qui se généralise à travers plusieurs tâches. L'idée clé est de définir une politique paramétrée comme une fonction à la fois de l'état et de la tâche, ce qui permet d'apprendre une seule politique qui se généralise à travers plusieurs tâches connues et inconnues. Des applications de notre approche novatrice à l'apprentissage par renforcement et à l'imitation dans des expériences avec des robots réels sont présentées.

Bookmark

Recherche de politiques multitâches pour la robotique

Key Points

Abstract

Cite This Study