May 3, 2024Open Access

MCMC法を用いたデモンストレーションアルゴリズムの学習向上に向けて

Key Points

Key points are not available for this paper at this time.

Abstract

行動クローン、またはより広義にはデモンストレーションからの学習（LfD）は、複雑なシナリオにおけるロボットポリシー学習にとって有望な方向性です。実装が簡単でデータ効率が良いにもかかわらず、行動クローンには独自の欠点があり、実際のロボットセットアップにおけるその有効性を制限しています。本研究では、暗黙のエネルギーベースのポリシーモデルを活用することで、デモンストレーションアルゴリズムの学習向上に一歩近づくことを目指しています。選定された複雑なロボットポリシー学習シナリオにおいて、暗黙のモデルを用いた教師ありポリシー学習は、一般的に広く使用されているニューラルネットワークベースの明示的モデルよりも平均して良好な結果を示すことが示唆されています。特に、潜在的に不連続で多峰的な関数の近似に関してはその傾向が顕著です。

MCMC法を用いたデモンストレーションアルゴリズムの学習向上に向けて

Key Points

Abstract

Cite This Study

Also Consider

Also Consider