近年、多くの国がヒューマノイドロボット分野への投資を増やし、重要な技術開発を促進しています。本研究の目的は、ヒューマノイドロボットがさまざまな複雑な環境に適応できるようにし、運動システムの堅牢性と運動戦略の一般化能力を向上させることです。強化学習アルゴリズムを使用し、多様な地形での訓練は適応可能なヒューマノイドロボットの開発に重要な要素です。本論文では、ヒューマノイドロボットG1を研究プラットフォームとして使用します。まず、平地歩行モデルの訓練、転送検証、実機展開を完了します。次に、ファジィ論理制御と段階的訓練戦略を使用して、階段の上り下りや傾斜の横断用の歩行モデルを訓練します。階段の高さと傾斜の勾配を体系的に変化させることにより、報酬関数の収束とタスク完了成功率を分析します。さらに、複雑な地形におけるロボットの動的安定性を定性的運動学分析を通じて検証します。研究の結論は、単一ステップの高さと傾斜の勾配が増加するにつれて、報酬値は初めにより多くの反復によって上昇しますが、収束は遅く、最終的な値は低くなることです。統計分析により、階段と傾斜地形の段階的訓練成功率はそれぞれ86%以上、92%以上であることが示されました。
Wenら(Sat、)はこの問題を研究しました。