Key points are not available for this paper at this time.
मशीन लर्निंग में गायब डेटा को संभालना महत्वपूर्ण है, लेकिन कई डेटा सेट में गलतियों या गैर-प्रतिक्रिया के कारण अंतराल होते हैं। पारंपरिक विधियों जैसे लिस्टवाइज विलोपन के विपरीत, जो सरल लेकिन अपर्याप्त हैं, साहित्य में अधिक जटिल और प्रभावी विधियों की पेशकश की जाती है, जिससे नमूना आकार और सटीकता में सुधार होता है। हालांकि, ये विधियाँ संपूर्ण डेटा सेट तक पहुँचने की आवश्यकता करती हैं, जो तब डेटा को कई स्रोतों में वितरित किया जाता है तो गोपनीयता नियमों का उल्लंघन करती हैं। विशेष रूप से चिकित्सा और स्वास्थ्य देखभाल के क्षेत्र में, इस तरह की पहुँच रोगियों के बारे में संवेदनशील जानकारी प्रकट करती है। यह अध्ययन संवेदनशील डेटा के लिए गोपनीयता संरक्षित इंप्यूटेशन विधियों को सुरक्षित मल्टी-पार्टी कंप्यूटेशन का उपयोग करके संबोधित करता है, जो किसी भी पार्टी की संवेदनशील जानकारी को प्रकट किए बिना सुरक्षित गणनाओं की अनुमति देता है। इस अध्ययन में, हमने गोपनीयता- संरक्षित तरीके से माध्य, माध्यिका, रिग्रेशन, और kNN इंप्यूटेशन विधियों को लागू किया। हम विशेष रूप से चिकित्सा और स्वास्थ्य देखभाल के क्षेत्रों पर ध्यान केंद्रित करते हैं, रोगी डेटा के संरक्षण के महत्व को ध्यान में रखते हुए, हमारे तरीकों को मधुमेह डेटा सेट पर प्रदर्शित करते हैं। मधुमेह डेटा सेट पर प्रयोगों ने हमारे गोपनीयता- संरक्षित इंप्यूटेशन विधियों की शुद्धता को मान्यता दी, जिसमें सबसे बड़ा त्रुटि लगभग 3 10^-3 था, जो plaintext विधियों से निकटता से मेल खाता है। हमने नमूने की संख्या में भिन्नता के लिए हमारी विधियों की स्केलेबिलिटी का भी विश्लेषण किया, जो वास्तविक दुनिया की स्वास्थ्य देखभाल समस्याओं के लिए उनकी प्रासंगिकता को दर्शाता है। हमारा विश्लेषण दर्शाता है कि हमारी सभी विधियाँ नमूनों की संख्या के साथ रेखीय रूप से स्केल होती हैं। kNN को छोड़कर, हमारी सभी विधियों का रनटाइम दर्शाता है कि वे बड़े डेटा सेट के लिए उपयोग की जा सकती हैं।
Jentsch et al. (Wed,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: