March 16, 2024Open Access

コンテキスト対応型モーション予測を支える大型言語モデル

Key Points

Key points are not available for this paper at this time.

Abstract

モーション予測は自動運転における最も基本的なタスクの一つです。従来のモーション予測方法は、主に地図のベクトル情報や交通参加者の過去の軌跡データをエンコードしており、全体の交通セマンティクスに対する包括的な理解を欠いています。これにより、予測タスクの性能に影響が及びます。本論文では、大型言語モデル（LLM）を利用してモーション予測タスクのためのグローバルな交通コンテキスト理解を強化しました。まず、体系的なプロンプトエンジニアリングを実施し、複雑な交通環境や交通参加者の過去の軌跡情報を画像プロンプト（交通コンテキストマップ：TC-Map）として可視化し、対応するテキストプロンプトを付けました。このアプローチにより、LLMから豊富な交通コンテキスト情報を取得しました。この情報をモーション予測モデルに統合することで、そのコンテキストがモーション予測の精度を向上させることを示します。さらに、LLMに関連するコストを考慮し、コスト効果の高い展開戦略を提案します：0.7\% LLM強化データセットを使って、大規模なモーション予測タスクの精度を向上させることです。我々の研究は、LLMの交通シーン理解を強化し、自動運転のモーション予測性能を向上させるための貴重な洞察を提供します。

コンテキスト対応型モーション予測を支える大型言語モデル

Key Points

Abstract

Cite This Study