What question did this study set out to answer?

उद्देश्य प्रोटीन भाषा मॉडलों का उपयोग करके बैक्टीरियल स्रावित प्रोटीन की सटीक भविष्यवाणी के लिए कम्प्यूटेशनल विधि विकसित करना है।

April 10, 2026Open Access

PLM-एफेक्ट: बैक्टीरियल स्रावित प्रोटीन की भविष्यवाणी के लिए प्रोटीन भाषा मॉडल की संभावनाओं को उजागर करना

Key Points

उद्देश्य प्रोटीन भाषा मॉडलों का उपयोग करके बैक्टीरियल स्रावित प्रोटीन की सटीक भविष्यवाणी के लिए कम्प्यूटेशनल विधि विकसित करना है।
प्रोटीन भाषा मॉडलों को न्यूरल वास्तुकलाओं के साथ एकीकृत करते हुए PLM-Effector विकसित किया।
बेहतर भविष्यवाणी सटीकता के लिए दो-परत एनसेंबल स्टैकिंग रणनीति का उपयोग किया।
प्रणाली-प्रकार सचेत भविष्यवाणियों के लिए N- और C-टर्मिनल क्षेत्रों से विशेषताएँ निकालीं।
प्रदर्शन सत्यापन हेतु सामान्य-उद्देश्य भाषा मॉडलों के विरुद्ध मानक परीक्षण किए।
T1SS-T4SS और T6SS के लिए क्रमशः 0.9848, 0.8649, 0.9899, 0.9620, और 0.9728 के मैक्रो F1-स्कोर प्राप्त किए।
स्रावित प्रोटीन भविष्यवाणी में मौजूदा उपकरणों और होमोलॉजी-आधारित विधियों से बेहतर प्रदर्शन किया।
छोटे पैमाने और जीनोम-विस्तृत भविष्यवाणियों के लिए उपयोगकर्ता-अनुकूल वेब सर्वर प्रदान किया।

Abstract

बैक्टीरियल स्रावित प्रोटीन्स, विशेषकर वे एफेक्टर्स जो विशेष स्रावण प्रणालियों द्वारा पहुंचाए जाते हैं, संक्रमणशीलता और मेजबान-पाथोजन अंतःक्रियाओं के मुख्य मध्यस्थ होते हैं। हालांकि, सटीक कम्प्यूटेशनल पहचान चुनौतीपूर्ण बनी रहती है क्योंकि अधिकांश मौजूदा विधियाँ अनुक्रम समानता या हस्तनिर्मित विशेषताओं पर अत्यधिक निर्भर करती हैं और अक्सर एक ही स्रावण प्रणाली पर केंद्रित होती हैं। हाल के अध्ययनों से पता चला है कि कुछ बैक्टीरियल एफेक्टर्स एक से अधिक स्रावण प्रणालियों से जुड़े हो सकते हैं, जो स्रावण प्रणाली की व्याख्या की जटिलता को उजागर करता है और सिस्टम-अनुसार कम्प्यूटेशनल भविष्यवाणी दृष्टिकोण के विकास को प्रोत्साहित करता है। यहाँ, हम प्रस्तुत करते हैं PLM-Effector, एक हाइब्रिड डीप लर्निंग फ्रेमवर्क जो आधुनिक प्रोटीन भाषा मॉडलों (PLMs) को कई न्यूरल वास्तुकलाओं के साथ दो-परत एनसेंबल स्टैकिंग रणनीति द्वारा एकीकृत करता है। N- और C-टर्मिनल क्षेत्रों से पूरक विशेषताएँ निकालकर, PLM-Effector पांच प्रमुख बैक्टीरियल स्रावण प्रणालियों (T1SS-T4SS और T6SS) में स्रावण-प्रकार-ज्ञान युक्त भविष्यवाणी सक्षम करता है, प्रत्येक प्रणाली स्वतंत्र रूप से मॉडल की गई है। व्यवस्थित परीक्षण से पता चला कि प्रोटीन-विशिष्ट PLMs (ESM-1b, ESM2ₜ33, ProtT5) के एम्बेडिंग्स सामान्य-उद्देश्य भाषा मॉडलों (जैसे BERT, BioBERT) की तुलना में अधिक भेदक होते हैं। इन प्रतिरूपों का लाभ उठाते हुए, PLM-Effector स्वतंत्र परीक्षण सेट पर उत्कृष्ट प्रदर्शन करता है, T1SS-T4SS और T6SS के स्रावित प्रोटीन के लिए क्रमशः मैक्रो F1-स्कोर 0.9848, 0.8649, 0.9899, 0.9620, और 0.9728 प्राप्त करता है, जो विद्यमान उपकरणों और होमोलॉजी-आधारित आधाररेखाओं को पीछे छोड़ता है। एक सुलभ वेब सर्वर (http://www.mgc.ac.cn/PLM-Effector/) के रूप में लागू, स्रोत कोड और डेटासेट उपलब्ध (https://github.com/zhengdd0422/PLM-Effector/) कराते हुए, PLM-Effector छोटे पैमाने और जीनोम-विस्तारित स्रावित प्रोटीन खोज के लिए पुनरुत्पाद्य और उपयोगकर्ता-अनुकूल मंच प्रदान करता है, जो बैक्टीरियल रोगजन्यता के अध्ययन में प्रगति को सहारा देता है।

PLM-एफेक्ट: बैक्टीरियल स्रावित प्रोटीन की भविष्यवाणी के लिए प्रोटीन भाषा मॉडल की संभावनाओं को उजागर करना

Key Points

Abstract

Cite This Study