August 26, 2024Open Access

PVAFN: マルチプーリング強化によるポイントボクセルアテンション融合ネットワーク 3D物体検出のための

Key Points

Key points are not available for this paper at this time.

Abstract

ポイントとボクセルの表現の統合は、LiDARベースの3D物体検出でますます一般的になっています。しかし、この組み合わせは、意味情報を効果的にキャプチャすることがよく苦労します。さらに、関心領域内のポイント特徴だけに依存すると、情報の損失や局所的な特徴表現の制限につながる可能性があります。これらの課題に対処するために、ポイントボクセルアテンション融合ネットワーク（PVAFN）と呼ばれる新しい二段階の3D物体検出器を提案します。PVAFNは、特徴抽出段階でマルチモーダル特徴融合を改善するためにアテンションメカニズムを活用します。洗練段階では、マルチプーリング戦略を利用して、マルチスケールおよび領域特異的情報を効果的に統合します。ポイントボクセルアテンションメカニズムは、ポイントクラウドとボクセルベースのバードアイビュー（BEV）特徴を適応的に結合し、より豊かな物体表現を実現し、誤検出を減少させます。さらに、モデルの認識能力を向上させるために、マルチプーリング強化モジュールが導入されています。このモジュールは、クラスタープーリングとピラミッドプーリング技術を利用して、重要な幾何学的詳細や細かい形状構造を効率的にキャプチャし、局所およびグローバル特徴の統合を強化します。KITTIおよびWaymoデータセットでの広範な実験により、提案されたPVAFNが競争力のある性能を達成することが示されています。コードとモデルは利用可能になります。

PVAFN: マルチプーリング強化によるポイントボクセルアテンション融合ネットワーク 3D物体検出のための

Key Points

Abstract

Cite This Study

Also Consider

Also Consider