August 15, 2025Open Access

未知の複雑な環境における視覚に基づく強化学習を用いたモデルフリーUAVナビゲーション

Key Points

提案されたフレームワークは、複雑な環境で安定したナビゲーションを低遅延で実現し、応答性を高めます。
主要な証拠は、統一されたモデルフリーアプローチが多様なシナリオで効果的な一般化を示すことを示しています。
深度画像とUAV状態情報を使用した観察分析により、畳み込みポリシーネットワークを通じてナビゲーションコマンドが改善されます。
この手法は、未知の環境をナビゲートするために重要な適応型飛行行動の可能性を強調しています。

Abstract

未知の複雑な環境における自律UAVナビゲーションは、特に限られたセンサーと計算リソースの下で重要な課題のままです。ほとんどの手法はマッピング、計画、制御を伴うモジュール型パイプラインに依存していますが、リアルタイム性能が悪く、適応性が限られ、正確な環境モデルへの依存が高いことがよくあります。さらに、多くの深層学習ベースのソリューションは、視覚ノイズに対して弱いRGB画像を使用するか、単一の目的のみを最適化します。それに対して、本稿では、搭載された深度画像とUAV状態情報を通じて連続ナビゲーションコマンドに直接マッピングする統一されたモデルフリー視覚ベースのDRLフレームワークを提案します。このエンドツーエンドアーキテクチャは、明示的なマッピングとモジュール調整の必要性を排除し、応答性と堅牢性を大幅に向上させます。新しい多目的報酬関数は、経路効率、安全性、エネルギー消費を共同で最適化するように設計されており、未知の複雑な環境における適応型飛行行動を可能にします。訓練されたポリシーは多様なシミュレーションシナリオでの一般化を示し、現実のUAV飛行に効果的に移行します。実験により、我々のアプローチが安定したナビゲーションと低遅延を実現することが示されています。

未知の複雑な環境における視覚に基づく強化学習を用いたモデルフリーUAVナビゲーション

Key Points

Abstract

Cite This Study