Key points are not available for this paper at this time.
प्रोटीन के बीच दूरस्थ विकासात्मक संबंधों का सटीक पता लगाना जैव सूचना विज्ञान में एक निरंतर चुनौती बनी हुई है। प्राथमिक अनुक्रम पर आधारित खोज विधियाँ 20% से कम अमीनो एसिड पहचान के साथ अनुक्रमों के बीच समानता का सटीक पता लगाने में संघर्ष करती हैं। प्रोफ़ाइल- और संरचना-आधारित रणनीतियाँ इस अनुक्रम समानता के अस्तित्व के क्षेत्र में संवेदनशील खोज क्षमताओं को बढ़ाती हैं लेकिन धीमी पूर्व-संसाधन कदमों की आवश्यकता होती है। हाल ही में, गहरी न्यूरल नेटवर्क से पूरे प्रोटीन और स्थानिक एम्बेडिंग ने लंबे विकासात्मक दूरियों पर संवेदनशील अनुक्रम तुलना और एनोटेशन प्रदान करने का वादा दिखाया है। एम्बेडिंग आमतौर पर प्रोफ़ाइल और अनुमानित संरचनाओं की तुलना में तेजी से गणना की जाती हैं लेकिन फिर भी पूरे प्रोटीन एम्बेडिंग के डोमेन-स्तरीय समानता को भेदने की क्षमता और स्थानिक एम्बेडिंग का उपयोग करने वाली विधियों के डेटाबेस आकार और खोज गति से संबंधित कई कमी का सामना करती हैं। इस कार्य में, हम दिखाते हैं कि निम्न-आयामीता वाले स्थानिक एम्बेडिंग को गति-ऑप्टिमाइज़्ड स्थानीय खोज एल्गोरिदम में सीधे उपयोग किया जा सकता है। अवधारणा का प्रमाण देने के लिए, हम ESM2 3B मॉडल का उपयोग प्राथमिक अनुक्रमों को सीधे 3Di वर्णमाला या अमीनो एसिड प्रोफ़ाइल में परिवर्तित करने के लिए करते हैं और इन एम्बेडिंग का उपयोग अत्यधिक ऑप्टिमाइज़्ड Foldseek, HMMER3, और HH-suite खोज एल्गोरिदम में इनपुट के रूप में करते हैं। हमारे परिणाम सुझाव देते हैं कि एकल बाइट के रूप में छोटे स्थानिक एम्बेडिंग भी अमीनो एसिड अनुक्रम खोज पर नाटकीय रूप से संवेदनशीलता में सुधार के लिए पर्याप्त जानकारी प्रदान कर सकते हैं बिना खोज गति को नुकसान पहुँचाए।
Johnson et al. (Mon,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: