Key points are not available for this paper at this time.
変形可能な部分モデル(DPM)と畳み込みニューラルネットワーク(CNN)は、視覚認識に広く使用されている二つのツールです。これらは通常、DPMがグラフィカルモデル(マルコフ確率場)であり、CNNが「ブラックボックス」の非線形分類器であるため、異なるアプローチと見なされます。本論文では、DPMをCNNとして定式化できることを示し、両者のアイデアを統合します。我々の構成では、DPM推論アルゴリズムを展開し、各ステップを同等のCNN層にマッピングすることが含まれます。この視点から見ると、DPMで使用される標準画像特徴を学習された特徴抽出器に置き換えることは自然です。我々は、得られたモデルをDeepPyramid DPMと呼び、PASCAL VOCの物体検出で実験的に検証します。DeepPyramid DPMは、方向勾配ヒストグラム特徴(HOG)に基づくDPMを大幅に上回り、最近導入されたR-CNN検出システムの同等のバージョンをわずかに上回りながら、はるかに速く動作することが分かりました。
Girshick et al. (Mon,) はこの問題を研究しました.