Key points are not available for this paper at this time.
モーション予測は自動運転における最も基本的なタスクの一つです。従来のモーション予測方法は、主に地図のベクトル情報や交通参加者の過去の軌跡データをエンコードしており、全体の交通セマンティクスに対する包括的な理解を欠いています。これにより、予測タスクの性能に影響が及びます。本論文では、大型言語モデル(LLM)を利用してモーション予測タスクのためのグローバルな交通コンテキスト理解を強化しました。まず、体系的なプロンプトエンジニアリングを実施し、複雑な交通環境や交通参加者の過去の軌跡情報を画像プロンプト(交通コンテキストマップ:TC-Map)として可視化し、対応するテキストプロンプトを付けました。このアプローチにより、LLMから豊富な交通コンテキスト情報を取得しました。この情報をモーション予測モデルに統合することで、そのコンテキストがモーション予測の精度を向上させることを示します。さらに、LLMに関連するコストを考慮し、コスト効果の高い展開戦略を提案します:0.7\% LLM強化データセットを使って、大規模なモーション予測タスクの精度を向上させることです。我々の研究は、LLMの交通シーン理解を強化し、自動運転のモーション予測性能を向上させるための貴重な洞察を提供します。
Zheng et al. (Sat,) はこの問題を研究しました。