Key points are not available for this paper at this time.
डेटाबेस को लिंक करने का कार्य डेटा खनन परियोजनाओं की बढ़ती संख्या में एक महत्वपूर्ण कदम है, क्योंकि लिंक किए गए डेटा में ऐसी जानकारी हो सकती है जो अन्यथा उपलब्ध नहीं है, या विशेष डेटा के समय-साध्य और महंगे संग्रह की आवश्यकता होगी। लिंकिंग का उद्देश्य सभी रिकॉर्डों को मिलाना और एकत्र करना है जो एक ही इकाई को संदर्भित करते हैं। बड़ी डेटाबेस को लिंक करते समय एक प्रमुख चुनौती रिकॉर्ड जोड़ों को मेल और गैर-मेल में सटीक और कुशलता से वर्गीकृत करना है। जबकि पारंपरिक रूप से वर्गीकरण मैन्युअल रूप से सेट की गई थ्रेसहोल्ड या सांख्यिकी प्रक्रियाओं पर आधारित था, हाल के विकसित वर्गीकरण विधियों में से कई पर्यवेक्षित अधिगम तकनीकों पर आधारित हैं। इसलिए, उन्हें प्रशिक्षण डेटा की आवश्यकता होती है, जो अक्सर वास्तविक दुनिया की परिस्थितियों में उपलब्ध नहीं होती या मैन्युअल रूप से तैयार करनी होती है, जो एक महंगा, जटिल और समय लेने वाला प्रक्रिया है।
पीटर क्रिसेन (सन,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: