June 1, 2014

画像リサイズなしで1つの分類器のみを使用したワードチャネルベースのマルチスケール歩行者検出

Key Points

Key points are not available for this paper at this time.

Abstract

高い精度と正確さを実現し、リアルタイムアプリケーションに使用できるほとんどの歩行者検出アプローチは、勾配方向のヒストグラムに基づいています。通常、マルチスケール検出は、画像を何度もリサイズし、画像特徴を再計算するか、異なるスケールに対して複数の分類器を使用することで達成されます。本論文では、単一スケールのために計算された画像特徴に基づいて、すべての歩行者スケールに対して同じ分類器を使用する歩行者検出アプローチを提案します。我々は、低レベルのピクセル単位の勾配方向ビンを超え、ワードチャネルに整理された高次の視覚ワードを使用します。ブースティングを使用して、統合されたワードチャネルから分類特徴を学習します。提案されたアプローチは複数のデータセットで評価され、INRIAおよびCaltech-USAベンチマークで優れた結果を達成しています。GPU実装を使用することで、1秒あたり1000万のバウンディングボックスを超える分類率と、640×480画像におけるマルチスケール検出のための16 FPSのレートを達成しています。

Bookmark

画像リサイズなしで1つの分類器のみを使用したワードチャネルベースのマルチスケール歩行者検出

Key Points

Abstract

Cite This Study