未知の複雑な環境における自律UAVナビゲーションは、特に限られたセンサーと計算リソースの下で重要な課題のままです。ほとんどの手法はマッピング、計画、制御を伴うモジュール型パイプラインに依存していますが、リアルタイム性能が悪く、適応性が限られ、正確な環境モデルへの依存が高いことがよくあります。さらに、多くの深層学習ベースのソリューションは、視覚ノイズに対して弱いRGB画像を使用するか、単一の目的のみを最適化します。それに対して、本稿では、搭載された深度画像とUAV状態情報を通じて連続ナビゲーションコマンドに直接マッピングする統一されたモデルフリー視覚ベースのDRLフレームワークを提案します。このエンドツーエンドアーキテクチャは、明示的なマッピングとモジュール調整の必要性を排除し、応答性と堅牢性を大幅に向上させます。新しい多目的報酬関数は、経路効率、安全性、エネルギー消費を共同で最適化するように設計されており、未知の複雑な環境における適応型飛行行動を可能にします。訓練されたポリシーは多様なシミュレーションシナリオでの一般化を示し、現実のUAV飛行に効果的に移行します。実験により、我々のアプローチが安定したナビゲーションと低遅延を実現することが示されています。
Wu et al. (Tue,) がこの問題を研究しました。