Key points are not available for this paper at this time.
إن تقنيات التعرف على الكلام الحديثة تظهر أداءً أقل من المثالي عند التعرف على كلام الأطفال. إن ندرة كلام الأطفال تحد من تطوير تقنيات التعرف على الكلام للأطفال (CSR). لذلك، درسنا تحويل الصوت من طفل إلى طفل (VC) من المتحدثين الأطفال الموجودين في قاعدة البيانات ومتحدثين أطفال إضافيين (جدد) من خلال تقنيات تحويل الصوت أحادية اللغة وعابرة اللغة (من الهولندية إلى الألمانية). وأظهرت النتائج أن تحويل الصوت عابر اللغة من طفل إلى طفل قد حسن بشكل كبير من أداء تقنيات التعرف على الكلام للأطفال. أعطت التجارب حول تأثير كمية البيانات المولّدة بواسطة تحويل الصوت عابر اللغة من طفل إلى طفل على تحسين نماذج التعرف على الكلام النتائج الأفضل مع تضخيم بمقدار مرتين لنموذج FT-Conformer ونموذج FT-Whisper، مما قلل من معدلات الخطأ في التعرف على الكلمات (WERs) بنسبة ~3% بالمقارنة مع الأساس، ومع تضخيم بمقدار ست مرات للنموذج الذي تم تدريبه من الصفر، والذي تحسن بنسبة 3.6% WER بشكل مطلق. علاوة على ذلك، استخدمت كمية صغيرة من البيانات المولّدة بواسطة تحويل الصوت
Zhang et al. (Wed,) studied this question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: