Key points are not available for this paper at this time.
本論文では、DCASE 2018 Challengeの音響シーン分類タスクと、このタスクのために提供されたTUT Urban Acoustic Scenes 2018データセットを紹介し、ベースラインシステムの性能を評価します。このチャレンジの過去数年と同様に、このタスクは短いオーディオサンプルをあらかじめ定義された音響シーンクラスの1つに分類するために定義されており、監視されたクローズドセット分類設定を使用しています。新たに録音されたTUT Urban Acoustic Scenes 2018データセットは、10種類の異なる音響シーンで構成されており、6つの大欧州市場で収録されました。したがって、以前のデータセットよりも高い音響の変動性を持ち、高品質なバイノーラル録音に加えて、モバイルデバイスで録音されたデータも含まれています。また、推奨されたクロスバリデーション設定を使用してサブタスクにおける性能を示す畳み込みニューラルネットワークを含むベースラインシステムを紹介します。
Mesaros et al. (Wed,) はこの問題を研究しました。