Key points are not available for this paper at this time.
この論文では、ビデオでの複数ターゲットの同時追跡の問題に取り組みます。まず、各ビデオフレームに対してオブジェクト検出器を適用します。次に、連続する2つのフレームからの検出応答のペアを使用して、トラックレットのグラフを構築します。このグラフは、結果のトラック間の厳格および柔軟な文脈制約を違反しない最良のマッチングトラックレットを推移的にリンクするのに役立ちます。このデータ関連性の問題は、グラフの最大重み独立集合(MWIS)を見つけることとして定式化できることを証明します。新しい多項式時間のMWISアルゴリズムを提示し、最適に収束することを証明します。データ関連性に使用されるオブジェクト検出間の類似性および文脈制約は、オブジェクトの外観と動きの特性からオンラインで学習されます。長期的な遮蔽は、MWISを繰り返し実行して小さなトラックを階層的に統合することによって対処されます。我々の結果は、マルチターゲットトラッキングにおいて柔軟および厳格な文脈制約を同時に考慮する利点を示しています。ベンチマークデータセットでも最先端の性能を上回りました。
Brendelら(Wed,)はこの問題を研究しました。