Key points are not available for this paper at this time.
スピーチからの感情認識は、実生活の設定で適用可能な程度まで成熟したため、達成可能なパフォーマンスについて現実的な見方をする時が来ました。この点においてほとんどの研究は過大評価を傾向にあります:演技データはしばしば自発的データの代わりに使用され、結果は事前に選択された典型的なデータについて報告され、真の話者の非分割評価は単純な交差検証よりも一般的ではありません。話者の非分割評価でさえ、今日の感情認識エンジンの一般化能力についてわずかしか洞察を与えません。なぜなら、システム開発に使用されるトレーニングデータとテストデータは、録音条件、ノイズの重なり、言語、感情の種類がすべて類似する傾向があるからです。インタセット評価によって、かなり現実的な印象が得られます。したがって、リソースを追加して学習する可能性を学ぶのに役立つ可能性のある6つの標準データベースを使用したコーパス間評価実験の結果を示します。観察された高いばらつきに対処するために、異なるタイプの正規化が調査されています。合計で1,800件の個別評価は、コーパス間テストの性能劣位を示唆しています。
シュラーら(木曜日)はこの問題を研究しました。