Key points are not available for this paper at this time.
प्रेरणा: आणविक जीव विज्ञान में रासायनिक यौगिकों का महत्व अधिक 강조 किया गया है, और 'रासायनिक जीनोमिक्स' ने हाल के वर्षों में बहुत ध्यान आकर्षित किया है। इसलिए वर्तमान आणविक जीव विज्ञान में एक महत्वपूर्ण मुद्दा जैविक-सम्बंधित रासायनिक यौगिकों (विशेष रूप से, औषधियों) और जीनों की पहचान करना है। साहित्य में जैविक संस्थाओं की सह-उपस्थिति इन संस्थाओं के संघ को खोजने के लिए एक सरल, व्यापक और लोकप्रिय तकनीक है। हमारा ध्यान साहित्य में सह-उपस्थिति से निहित 'रासायनिक यौगिक और जीन' संबंधों को खनन करने पर है। परिणाम: हम एक संभाव्य मॉडल, जिसे मिश्रण पहलू मॉडल (MAM) कहा जाता है, और इसके मापदंडों का अनुमान लगाने के लिए एक एल्गोरिदम प्रस्तावित करते हैं, जो एक साथ विभिन्न प्रकार के सह-उपस्थिति डेटासेट को प्रभावी ढंग से संभालता है। हमने MEDLINE रिकॉर्ड से उत्पन्न डेटा का उपयोग करके क्रॉस-वैलिडेशन के माध्यम से और ChEBI डेटाबेस में रासायनिक यौगिकों और जीनों के बीच संबंधों के स्वतंत्र मानव-परिपूर्ण डेटासेट का उपयोग करके हमारे दृष्टिकोण के प्रदर्शन की जांच की। हमने दोनों मामलों में तीन विभिन्न प्रकार के सह-उपस्थिति डेटासेट (जैसे, यौगिक-जीन्स, जीन-जीन और यौगिक-यौगिक सह-उपस्थतियाँ) पर प्रयोग किए। प्रयोगात्मक परिणामों ने दिखाया कि सभी डेटासेट द्वारा प्रशिक्षित MAM किसी भी सरल मॉडल से बेहतर प्रदर्शन करता है जो अन्य डेटासेट संयोजनों द्वारा प्रशिक्षित किया गया है और सभी मामलों में अंतर सांख्यिकीय रूप से महत्वपूर्ण है। विशेष रूप से, हमने पाया कि यौगिक-यौगिक सह-उपस्थितियों को शामिल करना भविष्यवाणी प्रदर्शन में सुधार करने में सबसे प्रभावी है। अंततः हमने अपने दृष्टिकोण का उपयोग करते हुए सभी अज्ञात यौगिक-जीन्स (विशेष रूप से, औषधि-जीन्स) जोड़ों की संभावना की गणना की और संभावनाओं के अनुसार शीर्ष 20 जोड़ों का चयन किया। हमने उन्हें जैविक, चिकित्सा और फार्मास्यूटिकल दृष्टिकोणों से मान्य किया।
झू एट अल. (गुरुवार,) ने इस प्रश्न का अध्ययन किया।