September 1, 2024

Sub-PNWR: 信号サブバンド分割と擬似ノイズ波形再構築損失に基づく音声強調

Key Points

Key points are not available for this paper at this time.

Abstract

既存の深層学習を基にした音声強調（SE）手法は、通常、高い計算複雑性を伴います。本論文では、入力音声を隣接した等間隔のサブバンド信号に分割し、これらのサブバンド信号をSEモデルに入力して、 denoisedサブバンド信号を復元することを提案します。これらのdenoisedサブバンド信号は、合成フィルターバンクによってフルバンド信号に再構築されます。同時に、フルバンドスペクトル情報でサブバンド特徴を補完するためのフルバンド情報融合モジュールを設計します。また、モデルのトレーニングを助けるために、ターゲットフルバンドスペクトルを予測するフルバンドスペクトル予測モジュールを考案します。さらに、より良いSEパフォーマンスのために擬似ノイズ波形再構築（PNWR）損失が導入されます。実験により、提案された方式が計算量を約半分に減少させ、ほぼ性能損失がないことが示されています。最終的なSEシステム（Sub-PNWR）は、現在の先進的手法を上回ります。

AIに質問

Bookmark