Key points are not available for this paper at this time.
이 연구는 음향-운율 정보(AP)와 의미 레이블(SL)을 사용하는 여러 분류기를 기반으로 한 감정적인 연설의 정서 인식 접근 방식을 제시합니다. AP 기반 인식을 위해 스펙트럼, 포먼트 및 피치 관련 특징을 포함한 음향 및 운율 특징이 입력된 연설의 감정적으로 두드러진 부분에서 추출됩니다. 세 가지 유형의 모델(GMM, SVM 및 MLP)이 기본 클래스 분류기로 채택됩니다. 그런 다음 Meta Decision Tree (MDT)를 사용하여 분류기 융합을 수행하여 AP 기반 감정 인식 신뢰도를 얻습니다. SL 기반 인식을 위해, 기존 중국 지식 기반인 HowNet에서 파생된 의미 레이블을 사용하여 감정적인 연설의 인식된 단어 순서에서 자동으로 감정 연관 규칙(EAR)을 추출합니다. 이후, 최대 엔트로피 모델(MaxEnt)이 감정 상태와 EAR 간의 관계를 특성화하여 감정 인식을 위한 모델로 사용됩니다. 마지막으로, 가중 곱 융합 방법을 사용하여 최종 감정 결정을 위해 AP 기반과 SL 기반 인식 결과를 통합합니다. 평가를 위해 4가지 감정 상태(중립, 행복, 화남, 슬픔)에 대해 2,033개의 발화를 수집하였습니다. 화자 독립 실험 결과, MDT 기반의 감정 인식 성능은 80.00%를 달성할 수 있으며, 이는 각각의 개별 분류기보다 우수합니다. 반면, SL 기반 인식에 대해서는 평균 인식 정확도 80.92%를 얻을 수 있습니다. 마지막으로, 음향-운율 정보와 의미 레이블을 결합하면 83.55%를 달성할 수 있으며, 이는 AP 기반이나 SL 기반 접근 방법보다 우수합니다. 또한 개인 맞춤형 응용을 위해 개별 성격 특성을 고려할 경우, 제안된 접근 방식의 인식 정확도를 85.79%로 더욱 향상시킬 수 있습니다.
Wu et al. (Thu,)는 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: