为了应对无线传输、远程协作和嵌入式音频设备中遇到的噪声污染、谱压缩和重建失真,本文提出了一种基于深度学习的框架,用于音乐导向传输信号的音频去噪和音频质量增强。设计了一种双路径卷积网络,结合频域注意力和感知引导的复合损失,同时对长期噪声和瞬时音乐细节进行建模。与DCCRN、SEGAN和U-Net等面向语音的模型不同,所提出的方法充分利用音乐特定的谱动态和相位一致性,以在复杂失真下实现高保真恢复。通过使用真实和模拟噪声场景进行评估,采用PESQ、STOI、SI-SNR和MOS-LQO等指标,该模型实现了平均PESQ为3.21,平均SI-SNR提高了16.4 dB,超越了基线模型。消融和谱可视化验证了关键模块。该框架具有强大的适应性,适用于实时远程音乐通信、协作系统和高保真声学采集。
杨松(星期四)研究了这个问题。