Key points are not available for this paper at this time.
ポイントとボクセルの表現の統合は、LiDARベースの3D物体検出でますます一般的になっています。しかし、この組み合わせは、意味情報を効果的にキャプチャすることがよく苦労します。さらに、関心領域内のポイント特徴だけに依存すると、情報の損失や局所的な特徴表現の制限につながる可能性があります。これらの課題に対処するために、ポイントボクセルアテンション融合ネットワーク(PVAFN)と呼ばれる新しい二段階の3D物体検出器を提案します。PVAFNは、特徴抽出段階でマルチモーダル特徴融合を改善するためにアテンションメカニズムを活用します。洗練段階では、マルチプーリング戦略を利用して、マルチスケールおよび領域特異的情報を効果的に統合します。ポイントボクセルアテンションメカニズムは、ポイントクラウドとボクセルベースのバードアイビュー(BEV)特徴を適応的に結合し、より豊かな物体表現を実現し、誤検出を減少させます。さらに、モデルの認識能力を向上させるために、マルチプーリング強化モジュールが導入されています。このモジュールは、クラスタープーリングとピラミッドプーリング技術を利用して、重要な幾何学的詳細や細かい形状構造を効率的にキャプチャし、局所およびグローバル特徴の統合を強化します。KITTIおよびWaymoデータセットでの広範な実験により、提案されたPVAFNが競争力のある性能を達成することが示されています。コードとモデルは利用可能になります。
Li et al. (Mon、)はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: