現代の産業および研究室環境では、ロボットアームは複雑で混雑した空間で操作されることが多い。信頼性のある障害物回避と効率的な動作計画を確保することは、安全なパフォーマンスのために不可欠である。従来の経路計画手法の欠点と知能自動化の需要の高まりに触発され、我々は修正された人工ポテンシャル場(APF)手法と深層決定論的ポリシー勾配アルゴリズムを組み合わせた新しい強化学習フレームワークを提案する。私たちのモデルは連続した環境で定式化されており、離散モデルと比較して現実世界の条件をより正確に反映している。このアプローチは従来のAPFの通常の局所最適問題に直接対処し、ロボットアームが複雑な三次元空間をナビゲートし、エンドエフェクタの軌道を最適化し、全体的な衝突回避を保証することを可能にする。我々の主な貢献には、APFフレームワークに強化学習要因を統合し、非最適な動作方向を修正するための補償項を含む特別な報酬メカニズムを設計することが含まれる。この設計は、障害物が密接に配置された環境におけるAPFの固有の制限を緩和するだけでなく、単純なシナリオでも複雑なシナリオでもパフォーマンスを向上させる。広範な実験により、我々の手法は、基準モデル(TD3ベースのバリアントを含む)と比較して、より少ないステップで低エネルギー消費で安全かつ効率的な障害物回避を達成することがわかった。これらの結果は、実際のアプリケーションにおけるロボットの移動計画を進展させる我々のアプローチの重要な可能性を明確に示している。
シュナイダーら(Fri)はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: