June 12, 2024Open Access

تحسين التعرف على الكلام الأطفال باستخدام كلام شبيه بالأطفال

Key Points

Key points are not available for this paper at this time.

Abstract

إن تقنيات التعرف على الكلام الحديثة تظهر أداءً أقل من المثالي عند التعرف على كلام الأطفال. إن ندرة كلام الأطفال تحد من تطوير تقنيات التعرف على الكلام للأطفال (CSR). لذلك، درسنا تحويل الصوت من طفل إلى طفل (VC) من المتحدثين الأطفال الموجودين في قاعدة البيانات ومتحدثين أطفال إضافيين (جدد) من خلال تقنيات تحويل الصوت أحادية اللغة وعابرة اللغة (من الهولندية إلى الألمانية). وأظهرت النتائج أن تحويل الصوت عابر اللغة من طفل إلى طفل قد حسن بشكل كبير من أداء تقنيات التعرف على الكلام للأطفال. أعطت التجارب حول تأثير كمية البيانات المولّدة بواسطة تحويل الصوت عابر اللغة من طفل إلى طفل على تحسين نماذج التعرف على الكلام النتائج الأفضل مع تضخيم بمقدار مرتين لنموذج FT-Conformer ونموذج FT-Whisper، مما قلل من معدلات الخطأ في التعرف على الكلمات (WERs) بنسبة ~3% بالمقارنة مع الأساس، ومع تضخيم بمقدار ست مرات للنموذج الذي تم تدريبه من الصفر، والذي تحسن بنسبة 3.6% WER بشكل مطلق. علاوة على ذلك، استخدمت كمية صغيرة من البيانات المولّدة بواسطة تحويل الصوت

تحسين التعرف على الكلام الأطفال باستخدام كلام شبيه بالأطفال

Key Points

Abstract

Cite This Study

Also Consider

Also Consider