Key points are not available for this paper at this time.
不確実な環境において、操縦する対象をリアルタイムで自律的かつ正確に追跡することは、無人航空機(UAV)にとっての挑戦的なミッションの一つです。本稿では、操縦する対象の追跡と障害物回避の制御問題に対処することを目指し、深層強化学習に基づくUAVのオンライン経路計画アプローチを開発しました。ニューラルネットワークによるエンドツーエンドの学習を通じて、提案されたアプローチは環境の認識と連続した運動出力制御を達成します。この提案手法には次のものが含まれます:(1) UAVの学習と自律的意思決定能力を提供するための深層決定論的ポリシー勾配(DDPG)ベースの制御フレームワーク;(2) オンライン最適計画のための確率的戦略を探索するのを助けるために混合ノイズの一種を導入するためのMN-DDPGと呼ばれる改良された手法;(3) MN-DDPGに基づいて構築されたUAVの制御モデルの一般化能力を向上させるための効率的な転移学習のためのタスク分解と事前トレーニングのアルゴリズム。実験シミュレーションの結果は、提案手法が操縦する対象の追跡タスクにおいて、UAVの飛行姿勢の良好な自己適応調整を達成し、不確実な環境におけるUAV追跡コントローラーの一般化能力とトレーニング効率の著しい向上を示しました。
Li et al. (Fri,)はこの問題を研究しました。
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: