サービスロボットが動的で複雑な環境に広く応用される中、歩行者の相互作用の複雑さや環境の不確実性により、そのナビゲーション能力には課題があります。従来の障害物回避法は群集内の社会的行動に対応することが困難であり、既存の深層強化学習ソリューションはモデル改善に重点を置く一方で、探索メカニズムの最適化を軽視しています。これらを踏まえ、本論文では時空間注意再帰ニューラルネットワーク(STA-RNN)と状態特徴エンコーダー(SFE)を融合したロボットナビゲーションフレームワークを提案します。時空間グラフモデルを構築することで、STA-RNNは歩行者行動の時空間依存性を暗黙的に捉え、階層的注意機構を組み合わせて重要な歩行者を動的に特定します。SFEは環境状態のエンコーディングを通じて内在報酬を生成し、ロボットが未知の領域を積極的に探索することを促進し、スパース報酬問題を緩和します。結果は、本モデルが実験シナリオで最高のナビゲーション成功率を達成し、ロボットの社会的適応性を向上させることを示しています。
Xingら(Tue,)がこの課題を研究しました。