Key points are not available for this paper at this time.
Les techniques d'apprentissage efficace par démonstration permettent d'enseigner des comportements complexes aux robots à partir d'un petit nombre de démonstrations. Un certain nombre de travaux récents ont exploré des approches interactives à la démonstration, dans lesquelles à la fois le robot et l'enseignant peuvent choisir des exemples d'entraînement. Dans cet article, nous nous concentrons sur un algorithme de sélection de démonstrations utilisé par le robot pour identifier des états informatifs à démontrer. Les approches automatisées existantes pour la sélection de démonstrations reposent généralement sur une seule valeur de seuil, qui est appliquée à une mesure de confiance dans l'action. Nous mettons en évidence les limites de l'utilisation d'un seuil fixe unique pour un sous-ensemble spécifique d'algorithmes et contribuons à une méthode permettant de définir automatiquement plusieurs seuils de confiance conçus pour cibler les états de domaine avec la plus grande incertitude. Nous présentons une comparaison de notre méthode de sélection à seuil multiple à la sélection basée sur la confiance en utilisant un seuil fixe unique, et à la sélection manuelle de données par un enseignant humain. Nos résultats indiquent que l'approche automatisée à seuil multiple réduit considérablement le nombre de démonstrations requises pour apprendre la tâche.
Chernova et al. (Mercredi,) ont étudié cette question.