Key points are not available for this paper at this time.
(UCアーバインでの作業中に実施) 物体認識システムのトレーニング用データセットは着実に大きくなっています。この論文では、既存の検出器がデータが増加するにつれて改善し続けるのか、それともモデルの複雑さやそれが操作する特徴空間に関連するベイズリスクのために飽和状態に近いのかという問いを検討します。我々は、方向付き勾配特徴に定義されたスキャンウィンドウテンプレートの一般的なパラダイムに焦点を当て、識別的分類器でトレーニングされます。我々は、テンプレートの数(複雑さ)とトレーニングデータの量に対するテンプレートの混合のパフォーマンスを調査します。追加のデータが役立つことが分かりますが、トレーニングデータ内のノイズのある例や「外れ値」を適切に正則化し、処理する場合に限ります。驚くべきことに、問題ドメインに依存しない混合モデルのパフォーマンスは急速に飽和状態に達するようです(約10のテンプレートと、各テンプレートあたり約100の正のトレーニング例)。しかし、合成混合(合成部分を介して実装)を使用すると、テンプレート間でパラメータを共有し、トレーニング中に遭遇しなかった新しいテンプレートを合成できるため、はるかに優れたパフォーマンスを発揮します。これは、改善された表現と学習アルゴリズムによって、線形分類器と既存の特徴空間でのパフォーマンスを向上させる余地がまだあることを示唆しています。1
Zhu et al.(Sun、)はこの問題を調査しました。