सारांश पॉइंट क्लाउड-आधारित त्रि-आयामी (3D) ऑब्जेक्ट डिटेक्शन स्वायत्त ड्राइविंग, रोबोटिक्स, और संवर्धित यथार्थता में एक महत्वपूर्ण कार्य है, जहां वस्तुओं का सटीक स्थान निर्धारण और वर्गीकरण विविध और चुनौतीपूर्ण परिस्थितियों में आवश्यक होता है। इस कार्य में Light Detection and Ranging (LiDAR) सेंसरों के उपयोग से पॉइंट क्लाउड-आधारित मल्टी-टारगेट 3D ऑब्जेक्ट डिटेक्शन फ्रेमवर्क प्रस्तुत किया गया है। मुख्य योगदान एन्कोडिंग तकनीक में सुधार करने में निहित है ताकि स्थानिक जानकारी संरक्षित रहे और विभिन्न पॉइंट घनत्वों के अनुरूप हो सके, जिससे कच्चे LiDAR डेटा का कुशल प्रक्रमण संभव हो और मजबूत 3D डिटेक्शन हो सके। विशेष रूप से, हमने एक प्रभावी नेटवर्क आर्किटेक्चर डिजाइन किया है जिसमें एक एकल एकीकृत वर्गीकरण हेड शामिल है जो सकारात्मक और नकारात्मक नमूनों को संयुक्त रूप से संभालता है, जिससे डिज़ाइन सरल और प्रशिक्षण स्थिरता में सुधार होता है। हमारा मॉडल एकल नेटवर्क के भीतर सभी वर्गों (कार, पैदल यात्री, साइक्लिस्ट) का एक साथ पता लगाता है, जिससे कम्प्यूटेशनल दक्षता बढ़ती है और प्रत्येक वर्ग के लिए अलग-अलग नेटवर्कों से बचा जाता है। इसके अतिरिक्त, प्रस्तावित फीचर निष्कर्षण पाइपलाइन एक वॉक्सेल-आधारित एन्कोडर को एक विरल रूप से एम्बेडेड कन्वोल्यूशनल बैकबोन और फीचर पिरामिड नेटवर्क के साथ जोड़ती है, जो बहु-स्तरीय फीचर प्रतिनिधित्व और विभिन्न पैमानों पर वस्तुओं का प्रभावी पता लगाने की सुविधा प्रदान करती है। यह एन्कोडिंग विधि कच्चे LiDAR डेटा के कुशल प्रक्रमण को सहज बनाती है, जिससे विविध परिस्थितियों में सटीक ऑब्जेक्ट डिटेक्शन संभव होता है। परिणामस्वरूप, हमारा मॉडल KITTI डेटासेट पर अत्याधुनिक प्रदर्शन करता है, PointPillars और VoxelNet जैसे बेसलाइन तरीकों से बेहतर औसत प्रेसिजन (AP) प्रदान करता है, जो कार वर्ग के लिए सभी कठिनता स्तरों में पक्षी-की-नज़र (BEV) और 3D ऑब्जेक्ट डिटेक्शन कार्यों दोनों में है। विशेष रूप से, यह BEV डिटेक्शन में Easy, Moderate, और Hard स्तरों के लिए क्रमशः 92.84%, 88.63%, और 85.68% AP40 स्कोर प्राप्त करता है और 3D डिटेक्शन में क्रमशः 87.84%, 76.65%, और 73.60% स्कोर देता है। ये परिणाम हमारे एन्कोडिंग तकनीक की प्रभावशीलता को विविध परिस्थितियों में मॉडल दक्षता और डिटेक्शन सटीकता बढ़ाने में दर्शाते हैं।
सौम्या आदि (मंगल,) ने इस प्रश्न का अध्ययन किया।