Key points are not available for this paper at this time.
इस पत्र में हम द्विदिशा लंबे समय की संक्षिप्त स्मृति (BLSTM) पुनरावर्ती न्यूरल नेटवर्क्स (RNNs) पर आधारित वास्तविक जीवन की रिकॉर्डिंग में बहुरूपी ध्वनि घटना पहचान के लिए एक दृष्टिकोण प्रस्तुत करते हैं। एकल मल्टीलेबल BLSTM RNN को कई श्रेणियों की ध्वनियों से बने मिश्रण संकेत के ध्वनिक विशेषताओं को प्रत्येक घटना श्रेणी के लिए द्विआधारी गतिविधि संकेतकों में मैप करने के लिए प्रशिक्षित किया गया है। हमारी विधि को 10 विभिन्न दैनिक संदर्भों में 61 श्रेणियों (जैसे संगीत, कार, भाषण) के साथ वास्तविक जीवन की रिकॉर्डिंग के एक बड़े डेटाबेस पर परीक्षण किया गया है। प्रस्तावित विधि पिछले दृष्टिकोणों की तुलना में बड़े अंतर से बेहतर है, और डेटा संवर्धन तकनीकों का उपयोग करके परिणामों को और बेहतर बनाया जाता है। कुल मिलाकर, हमारा सिस्टम 1 सेकंड के ब्लॉकों पर 65.5% का औसत F1-स्कोर और एकल फ़्रेमों पर 64.7% देता है, जो क्रमशः 6.8% और 15.1% की पूर्ववर्ती राज्य-कलाप से संबंधित सुधार है।
Parascandolo एट अल। (मंगलवार,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: