Key points are not available for this paper at this time.
نقوم بتطوير وعرض معمارية جديدة لشبكة عصبية عميقة ملتفة، حيث يتم استخدام التجميع المتنوع لتوفير ثبات منتظم في تحويل التردد في طيف الكلام مع تقليل الالتباس الناتج عن تلك الثبات في فئات الكلام. يتم توجيه تصميم طبقة التجميع بمعرفة المجال حول كيفية تغير فئات الكلام عند تعديل ترددات الفورمانت. تتبع طبقات الالتفاف والتجميع المتنوع شبكة عصبية متعددة الطبقات متصلة بالكامل لتشكيل بنية عميقة مرتبطة بنموذج ماركوف المخفي للتعرف المستمر على الكلام. خلال التدريب، يتم تنظيم جميع طبقات هذه الشبكة العميقة بالكامل باستخدام متغير من تقنية "التسرب". تظهر التقييمات التجريبية فعالية كل من التجميع المتنوع وتنظيم التسرب. في مهمة التعرف الصوتي TIMIT، حققنا معدل خطأ صوتي بنسبة 18.7٪، وهو الأدنى في هذه المهمة القياسية المبلغ عنها في الأدبيات باستخدام نظام واحد ودون استخدام معلومات عن هوية المتحدث. تظهر التجارب الأولية على التعرف على الكلام في المفردات الكبيرة في مهمة البحث الصوتي أيضًا تخفيضًا في معدل الخطأ باستخدام التجميع المتنوع في الشبكة العصبية العميقة.
دنج وآخرون (الأربعاء) درسوا هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: