Key points are not available for this paper at this time.
एक मोनोकोलर कैमरा का उपयोग करके दूरी अनुमान कंप्यूटर दृष्टि के लिए सबसे क्लासिक कार्यों में से एक है। वर्तमान मोनोकोलर दूरी अनुमान विधियों को बहुत अधिक डेटा संग्रह की आवश्यकता होती है या ये असटीक परिणाम उत्पन्न करती हैं। इस पेपर में, हम वस्तु पहचान और दूरी अनुमान दोनों के लिए एक नेटवर्क का प्रस्ताव करते हैं। एक नेटवर्क जो ShuffleNet और YOLO पर आधारित है, एक वस्तु का पता लगाने के लिए उपयोग किया जाता है, और दूरी के अनुमान के लिए आत्म-निगरानी शिक्षण नेटवर्क का उपयोग किया जाता है। हमने कैमरे को कैलीब्रेट किया, और कैलीब्रेटेड पैरामीटर को समग्र नेटवर्क में एकीकृत किया गया। हमने कैमरा स्थिति के पैरामीटर भिन्नता का भी विश्लेषण किया। आगे, एक मल्टी-स्केल रिज़ॉल्यूशन का उपयोग किया गया ताकि गहराई जानकारी की अभिव्यक्ति क्षमता को बढ़ाकर अनुमान की सटीकता में सुधार किया जा सके। हमने KITTI डेटासेट पर वस्तु पहचान और दूरी अनुमान के परिणामों का सत्यापन किया और दिखाया कि हमारा दृष्टिकोण कुशल और सटीक है। अंततः, हमने एक डेटासेट का निर्माण किया और नेटवर्क की सामान्यता को अन्य परिदृश्यों में सत्यापित करने के लिए समान प्रयोग किए। परिणाम दिखाते हैं कि हमारी प्रस्तावित विधियाँ वस्तु-विशेष दूरी अनुमानों पर वैकल्पिक दृष्टिकोणों की तुलना में बेहतर प्रदर्शन करती हैं.
हॉंग एट अल। (मंगल,) ने इस प्रश्न का अध्ययन किया।