May 3, 2024Open Access

Vers une amélioration des algorithmes d'apprentissage par démonstration via des méthodes MCMC

Key Points

Key points are not available for this paper at this time.

Abstract

Le clonage comportemental, ou plus largement, l'apprentissage par démonstration (LfD) est une direction prometteuse pour l'apprentissage des politiques des robots dans des scénarios complexes. Bien qu'il soit simple à mettre en œuvre et efficace en termes de données, le clonage comportemental présente ses propres inconvénients, limitant son efficacité dans des configurations de robots réels. Dans ce travail, nous faisons un pas vers l'amélioration des algorithmes d'apprentissage par démonstration en tirant parti des modèles de politiques basés sur l'énergie implicite. Les résultats suggèrent que dans des scénarios d'apprentissage de politiques de robots complexes sélectionnés, traiter l'apprentissage de politiques supervisées avec un modèle implicite présente généralement de meilleures performances, en moyenne, que les modèles explicites basés sur des réseaux de neurones couramment utilisés, en particulier dans les cas d'approximation de fonctions potentiellement discontinues et multimodales.

Vers une amélioration des algorithmes d'apprentissage par démonstration via des méthodes MCMC

Key Points

Abstract

Cite This Study

Also Consider

Also Consider