Key points are not available for this paper at this time.
डेटा सेट मशीन लर्निंग अनुसंधान के विकास में एक मौलिक भूमिका निभाते हैं। ये उन मॉडलों का आधार बनाते हैं जिन्हें हम डिजाइन और लागू करते हैं, साथ ही ये हमारी तुलना और मूल्यांकन के लिए प्राथमिक माध्यम हैं। इसके अलावा, हम जिन तरीकों से इन डेटा सेटों को एकत्र, निर्मित और साझा करते हैं, वे उस प्रकार की समस्याओं को सूचित करते हैं जिनका क्षेत्र अनुसरण करता है और उन तरीकों को जो एल्गोरिदम विकास में अन्वेषण किए जाते हैं। हालांकि, हाल के विभिन्न दृष्टिकोणों से किए गए काम ने डेटा सेट संग्रहण और उपयोग में प्रचलित प्रथाओं की सीमाओं को उजागर किया है। इस पत्र में, हम मशीन लर्निंग में डेटा को एकत्र करने और उपयोग करने के तरीके के बारे में उठाई गई कई चिंताओं का सर्वेक्षण करते हैं और सुझाव देते हैं कि डेटा की एक अधिक सतर्क और गहन समझ आवश्यक है ताकि क्षेत्र के कई व्यावहारिक और नैतिक मुद्दों का समाधान किया जा सके।
पॉल्लाडा एट अल। (बुध,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: