Key points are not available for this paper at this time.
الملخص إن التعرف الآلي على مشاعر الموسيقى (MER) هو مهمة صعبة في استرجاع معلومات الموسيقى مع تطبيقات واسعة النطاق. تطرح بعض الدراسات الأخيرة التعرف على مشاعر الموسيقى كمشكلة انحدار مستمر في مساحة الإثارة والقيمة (AV). تتكون هذه من تباينات على بنية شائعة تحتوي على نموذج عالمي للاستجابة العاطفية، ومجموعة شائعة من الميزات الصوتية الأساسية، ونهج كيس الإطارات لتحليل الصوت، ومجموعات بيانات صغيرة نسبيًا. تحقق هذه الأساليب بعض النجاح في MER وتقترح أن تحسينات إضافية ممكنة باستخدام التكنولوجيا الحالية. تساهم مقالتنا في الوضع الراهن من خلال فحص مدى إمكانية التقدم داخل هذا الإطار، والتحقيق في حدود هذا الإطار. نقدم نتائج دراسة منهجية أجريت في محاولة لتعظيم أداء التنبؤ لنظام MER الآلي باستخدام البنية الموصوفة. نبدأ بمجموعة بيانات مصممة بعناية، مع التركيز على الجودة أكثر من الكمية. نتناول تحفيز العواطف بدلاً من نسبتها. ننظر في مجموعة متنوعة من الخوارزميات في كل مرحلة من مراحل عملية التدريب، من المعالجة المسبقة إلى اختيار الميزات واختيار النموذج، ونقدم نتائج اختبارات واسعة النطاق. وجدنا أن: (1) أي من التباينات التي نظرنا فيها لا تؤدي إلى تحسين كبير في الأداء، وهو ما نقدمه كدليل على وجود حد لما هو achievable بموجب هذه البنية، و (2) إن حجم مجموعات البيانات الصغيرة المستخدمة بشكل شائع في أدبيات MER يحد من إمكانية تحسين مجموعة الميزات المستخدمة في MER بسبب ظاهرة تحيز اختيار المجموعة الفرعية. نختتم ببعض الاقتراحات لتعزيز الوضع الراهن.
دراسة هوك وآخرون (الأربعاء) هذا السؤال.