March 26, 2024Open Access

改良された双子遅延深層決定論的ポリシー勾配およびRRT*に基づくマニピュレーターのための経路計画手法

Key Points

Key points are not available for this paper at this time.

Abstract

本論文では、深層強化学習（DRL）からの経験再生メカニズムと迅速に探索するランダムツリー星（RRT*）を組み合わせた経路計画フレームワークを提案し、DRL-RRT*をマニピュレーターのための経路計画手法として採用します。RRT*の反復は経路計画において独立に行われ、曲がりくねった経路を生成し、最適経路を見つけることが困難になります。DRLに基づくポリシー学習における報酬関数の設定は非常に複雑であり、汎用性が低いため、複雑な経路計画においてタスクを完了することが難しいです。現在の決定論的ポリシー勾配DRLアルゴリズムである双子遅延深層決定論的ポリシー勾配（TD3）の探索不足に対処するために、確率的ポリシーがTD3と組み合わされ、シミュレーションプラットフォームで性能が検証されました。さらに、改良されたTD3がRRT*と統合され、2次元（2D）および3次元（3D）経路計画環境における性能分析が行われました。最後に、六自由度のマニピュレーターを用いて、マニピュレーターに関するシミュレーションおよび実験研究が行われました。

Read Full Paperexternally

AIに質問

Bookmark

View Full Paper