सार प्रेरणा बड़े पैमाने पर सिंगल-सेल ट्रांसक्रिप्टोम पर प्रशिक्षित फाउंडेशन मॉडल सेलुलर अवस्थाओं का समृद्ध आणविक प्रतिनिधित्व प्राप्त कर सकते हैं, फिर भी बल्क RNA-seq डेटा से कैंसर उत्तरजीविता पूर्वानुमान के लिए उनकी संभावनाएँ अधिकांशतः अनजानी हैं। परिणाम हमने TCGA से 25 कैंसर प्रकारों में मरीज-स्तरीय एम्बेडिंग निकालने हेतु सिंगल-सेल फाउंडेशन मॉडल scFoundation को लागू किया और कैंसर-विशिष्ट तथा पैन-कैंसर दोनों सेटिंग में उनके पूर्वानुमान मूल्य का व्यवस्थित रूप से मूल्यांकन किया। पूरक जानकारी का लाभ उठाने के लिए, हमने एक एम्बेडिंग–जीन–उत्तरजीविता पूर्वानुमान (EGSP) मॉडल विकसित किया जो फाउंडेशन मॉडल एम्बेडिंग को जीन अभिव्यक्ति और नैदानिक चर के साथ एकीकृत करता है। EGSP ने कैंसरों में औसत संगमांक सूचकांक (C-index) 0.724 प्राप्त किया और सात कैंसर प्रकारों में 0.8 से अधिक प्रदर्शन किया, जो लगातार एकल-गतिविधि मॉडलों और मौजूदा मल्टी-ओमिक्स उत्तरजीविता दृष्टिकोणों से बेहतर था। तुलनात्मक विश्लेषणों से पता चला कि pretrained scFoundation वज़न से प्राप्त एम्बेडिंग जीन अभिव्यक्ति के साथ कम अधिशेषता दर्शाती हैं जबकि पैन-कैंसर फाइन-ट्यून किये गए एम्बेडिंग की तुलना में पूरक पूर्वानुमान संकेत बनाए रखती हैं। व्याख्यायोग्य AI विश्लेषणों ने आगे बताया कि पूर्वानुमान एम्बेडिंग ट्यूमर विभेदन, प्रतिरक्षा गतिविधि, और ट्यूमर-आंतरिक विकास से संबंधित व्याख्यात्मक जैविक कार्यक्रमों को पकड़ती हैं, जिससे समूह और मरीज स्तर पर पारदर्शी उत्तरजीविता पूर्वानुमान संभव होता है। संपूर्ण रूप से, सिंगल-सेल फाउंडेशन मॉडल एम्बेडिंग्स जैविक रूप से महत्वपूर्ण और आंशिक रूप से गैर-अधिशेष उत्तरजीविता संकेत प्रदान करती हैं जो बल्क RNA-seq आधारित पूर्वानुमानात्मक मॉडलिंग में काफी सुधार करती हैं। उपलब्धता और कार्यान्वयन https://github.com/weiliu123/EGSP.
Liu et al. (Bud,) ने इस प्रश्न का अध्ययन किया।