जातीय संगीत की मुख्य विशेषता, "स्वर की सूक्ष्म परिवर्तन", का सटीक और स्वचालित विश्लेषण करने के लिए, और मौजूदा गणना मॉडलों की भारी लेबलयुक्त डेटा पर निर्भरता को दूर करने हेतु, इस अध्ययन में स्वयं-पर्यवेक्षित पिच अनुमानन, Pitch Estimation with Self-supervised Transposition-equivariant Objective (PESTO) एल्गोरिदम को एकीकृत करते हुए एक नया विश्लेषण मॉडल प्रस्तावित और सत्यापित किया गया है। इसमें PESTO-Unsupervised Clustering (PESTO-UC) नामक एक नया विश्लेषण ढांचा प्रस्तावित है, जो उन्नत स्वयं-पर्यवेक्षित पिच अनुमानन एल्गोरिदम PESTO और अनियोजित क्लस्टरिंग तकनीक को गहराई से एकीकृत करता है। सबसे पहले, PESTO का उपयोग मौलिक ऑडियो से सीधे उच्च-सटीक मूल आवृत्ति (F0) वक्र निकालने के लिए किया जाता है, जिससे भारी लेबलयुक्त डेटा पर निर्भरता से बचा जाता है। K-Means क्लस्टरिंग एल्गोरिदम का उपयोग निकाले गए पिच डेटा का विश्लेषण करने के लिए संगीत की आंतरिक पैमाना संरचना को स्वतः खोजने के लिए किया जाता है। भारतीय शास्त्रीय संगीत डेटासेट पर किए गए प्रायोगिक मूल्यांकन के परिणाम दिखाते हैं कि मॉडल का प्रदर्शन उत्कृष्ट है, कच्ची पिच त्रुटि (RPE) 7.81 तक कम है, और पैमाना खोज कार्य में सामान्यीकृत पारस्परिक सूचना (NMI) स्कोर 0.941 तक उच्च है। अतः प्रस्तावित मॉडल एल्गोरिदम एक कुशल, वस्तुनिष्ठ और व्यापक रूप से लागू अंत-से-अंत समाधान प्रदान करता है, तथा सीमित संसाधनों वाले जातीय संगीत विरासत के डिजिटल संरक्षण और गहन सैद्धांतिक अनुसंधान के लिए विस्तार योग्य गणना विचार प्रस्तुत करता है।
रॉन्ग ली (बुधवार) ने इस प्रश्न का अध्ययन किया।