Key points are not available for this paper at this time.
Le clonage comportemental, ou plus largement, l'apprentissage par démonstration (LfD) est une direction prometteuse pour l'apprentissage des politiques des robots dans des scénarios complexes. Bien qu'il soit simple à mettre en œuvre et efficace en termes de données, le clonage comportemental présente ses propres inconvénients, limitant son efficacité dans des configurations de robots réels. Dans ce travail, nous faisons un pas vers l'amélioration des algorithmes d'apprentissage par démonstration en tirant parti des modèles de politiques basés sur l'énergie implicite. Les résultats suggèrent que dans des scénarios d'apprentissage de politiques de robots complexes sélectionnés, traiter l'apprentissage de politiques supervisées avec un modèle implicite présente généralement de meilleures performances, en moyenne, que les modèles explicites basés sur des réseaux de neurones couramment utilisés, en particulier dans les cas d'approximation de fonctions potentiellement discontinues et multimodales.
Qi et al. (Fri,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: