Key points are not available for this paper at this time.
संक्षेप एकल-कोशिका ट्रांसक्रिप्टोमिक्स RNA अभिव्यक्ति स्तरों के साथ डेटा सेट प्रदान करता है, जो हजारों जीनों से मिलियन कोशिकाओं तक हो सकते हैं। सामान्य डेटा विश्लेषण पाइपलाइनों में डेटा को दो आयामों में देखने के लिए एक व्यासीय कमी कदम शामिल होता है, जिसे आमतौर पर t-प्रवित stochastic पड़ोसी एम्बेडिंग (t-SNE) का उपयोग करके किया जाता है। यह उच्च-आयामी डेटा में स्थानीय संरचना को प्रकट करने में उत्कृष्टता दर्शाता है, लेकिन नासमझ आवेदनों में अक्सर गंभीर कमी होती है, जैसे कि डेटा की वैश्विक संरचना का सटीक प्रतिनिधित्व नहीं किया जाता। यहाँ हम ऐसे pitfalls को कैसे पार करें, इसका वर्णन करते हैं, और अधिक विश्वसनीय t-SNE विज़ुअलाइजेशन बनाने के लिए एक प्रोटोकॉल विकसित करते हैं। इसमें PCA प्रारंभ किया जाता है, एक उच्च सीखने की दर, और बहु-स्केल समानता कर्नेल शामिल होते हैं; बहुत बड़े डेटा सेट के लिए, हम अतिरिक्त रूप से बढ़ाने और डाउनसैम्पलिंग-आधारित प्रारंभिककरण का उपयोग करते हैं। हम प्रकाशित एकल-कोशिका RNA-seq डेटा सेट का उपयोग करते हैं यह दिखाने के लिए कि यह प्रोटोकॉल नासमझ t-SNE के आवेदन की तुलना में श्रेष्ठ परिणाम प्रदान करता है।
कोबैक एट अल। (गुरुवार,) ने इस प्रश्न का अध्ययन किया।