January 1, 2012

क्या ऑब्जेक्ट डिटेक्शन के लिए हमें अधिक प्रशिक्षण डेटा चाहिए या बेहतर मॉडल?

Key Points

Key points are not available for this paper at this time.

Abstract

(UC Irvine में कार्य के दौरान किया गया) ऑब्जेक्ट रिकग्निशन सिस्टम के प्रशिक्षण के लिए डेटासेट्स लगातार बड़े होते जा रहे हैं। यह पेपर इस सवाल की जांच करता है कि क्या मौजूदा डिटेक्टर डेटा बढ़ने के साथ सुधारना जारी रखेंगे, या मॉडल सीमित मॉडल जटिलता और उन फीचर स्पेस के साथ जुड़े बेयस जोखिम के कारण संतृप्त होने के करीब हैं जिनमें वे काम करते हैं। हम ओरिएंटेड ग्रेडिएंट फीचर्स पर परिभाषित स्कैनिंग-विंडो टेम्पलेट्स के प्रसिद्ध पैरेडाइम पर ध्यान केंद्रित करते हैं, जिन्हें डिस्क्रिमिनेटिव क्लासिफायर्स के साथ प्रशिक्षित किया गया है। हम टेम्पलेट्स के मिश्रण का प्रदर्शन टेम्पलेट्स की संख्या (जटिलता) और प्रशिक्षण डेटा की मात्रा के रूप में जांचते हैं। हमें पता चलता है कि अतिरिक्त डेटा मदद करता है, लेकिन केवल सही रेग्युलराइज़ेशन और प्रशिक्षण डेटा में शोर या "आउटलायर्स" के ठीक से प्रबंधन के साथ। आश्चर्यजनक रूप से, समस्या डोमेन-एग्नोस्टिक मिश्रित मॉडलों का प्रदर्शन जल्दी संतृप्त हो जाता प्रतीत होता है (~10 टेम्पलेट्स और प्रति टेम्पलेट लगभग 100 सकारात्मक प्रशिक्षण उदाहरण)। हालांकि, रचनात्मक मिश्रण (संयुक्त भागों के माध्यम से लागू) बहुत बेहतर प्रदर्शन देते हैं क्योंकि वे टेम्पलेट्स के बीच पैरामीटर साझा करते हैं, और प्रशिक्षण के दौरान न देखे गए नए टेम्पलेट्स को संश्लेषित कर सकते हैं। इससे पता चलता है कि बेहतर प्रतिनिधित्व और सीखने के एल्गोरिदम द्वारा लाइनियर क्लासिफायर्स और मौजूदा फीचर स्पेस के साथ प्रदर्शन में सुधार की अभी भी गुंजाइश है। 1

AI से पूछें

Bookmark

AI से पूछें

Bookmark

क्या ऑब्जेक्ट डिटेक्शन के लिए हमें अधिक प्रशिक्षण डेटा चाहिए या बेहतर मॉडल?

Key Points

Abstract

Cite This Study