Key points are not available for this paper at this time.
本論文では、LaSOTという大規模単一物体追跡のための高品質ベンチマークを提案します。LaSOTは合計で1,400のシーケンスを含み、3.5Mフレーム以上のデータがあります。これらのシーケンスの各フレームは、バウンディングボックスで慎重かつ手動でアノテーションされており、LaSOTは我々の知る限り、最も大きく、密にアノテーションされた追跡ベンチマークです。LaSOTの平均ビデオ長は2,500フレーム以上であり、各シーケンスは、対象物体が視界から消え、再び現れるといった様々な課題を含んでいます。LaSOTを公開することで、深層追跡器の訓練と追跡アルゴリズムの実質的な評価のための高品質の大規模専用ベンチマークをコミュニティに提供することを期待しています。さらに、視覚的外観と言語の自然な関連性を考慮して、LaSOTを追加の言語仕様を提供することで豊かにし、追跡のための自然言語的特徴の探求を促進することを目指しています。LaSOT上での35の追跡アルゴリズムの徹底的な実験評価を詳細な分析と共に示し、その結果は改善の余地がまだ大いにあることを示しています。
Fanら(木曜日)はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: