बैक्टीरियल स्रावित प्रोटीन्स, विशेषकर वे एफेक्टर्स जो विशेष स्रावण प्रणालियों द्वारा पहुंचाए जाते हैं, संक्रमणशीलता और मेजबान-पाथोजन अंतःक्रियाओं के मुख्य मध्यस्थ होते हैं। हालांकि, सटीक कम्प्यूटेशनल पहचान चुनौतीपूर्ण बनी रहती है क्योंकि अधिकांश मौजूदा विधियाँ अनुक्रम समानता या हस्तनिर्मित विशेषताओं पर अत्यधिक निर्भर करती हैं और अक्सर एक ही स्रावण प्रणाली पर केंद्रित होती हैं। हाल के अध्ययनों से पता चला है कि कुछ बैक्टीरियल एफेक्टर्स एक से अधिक स्रावण प्रणालियों से जुड़े हो सकते हैं, जो स्रावण प्रणाली की व्याख्या की जटिलता को उजागर करता है और सिस्टम-अनुसार कम्प्यूटेशनल भविष्यवाणी दृष्टिकोण के विकास को प्रोत्साहित करता है। यहाँ, हम प्रस्तुत करते हैं PLM-Effector, एक हाइब्रिड डीप लर्निंग फ्रेमवर्क जो आधुनिक प्रोटीन भाषा मॉडलों (PLMs) को कई न्यूरल वास्तुकलाओं के साथ दो-परत एनसेंबल स्टैकिंग रणनीति द्वारा एकीकृत करता है। N- और C-टर्मिनल क्षेत्रों से पूरक विशेषताएँ निकालकर, PLM-Effector पांच प्रमुख बैक्टीरियल स्रावण प्रणालियों (T1SS-T4SS और T6SS) में स्रावण-प्रकार-ज्ञान युक्त भविष्यवाणी सक्षम करता है, प्रत्येक प्रणाली स्वतंत्र रूप से मॉडल की गई है। व्यवस्थित परीक्षण से पता चला कि प्रोटीन-विशिष्ट PLMs (ESM-1b, ESM2ₜ33, ProtT5) के एम्बेडिंग्स सामान्य-उद्देश्य भाषा मॉडलों (जैसे BERT, BioBERT) की तुलना में अधिक भेदक होते हैं। इन प्रतिरूपों का लाभ उठाते हुए, PLM-Effector स्वतंत्र परीक्षण सेट पर उत्कृष्ट प्रदर्शन करता है, T1SS-T4SS और T6SS के स्रावित प्रोटीन के लिए क्रमशः मैक्रो F1-स्कोर 0.9848, 0.8649, 0.9899, 0.9620, और 0.9728 प्राप्त करता है, जो विद्यमान उपकरणों और होमोलॉजी-आधारित आधाररेखाओं को पीछे छोड़ता है। एक सुलभ वेब सर्वर (http://www.mgc.ac.cn/PLM-Effector/) के रूप में लागू, स्रोत कोड और डेटासेट उपलब्ध (https://github.com/zhengdd0422/PLM-Effector/) कराते हुए, PLM-Effector छोटे पैमाने और जीनोम-विस्तारित स्रावित प्रोटीन खोज के लिए पुनरुत्पाद्य और उपयोगकर्ता-अनुकूल मंच प्रदान करता है, जो बैक्टीरियल रोगजन्यता के अध्ययन में प्रगति को सहारा देता है।
Zheng et al. (Sun,) ने इस प्रश्न का अध्ययन किया।