What type of study is this?

This is a Quantitative Study study.

September 29, 2025Open Access

标签噪声在特征学习过程中的作用

Key Points

标签噪声会导致深度学习模型的过拟合，降低对未见数据的泛化能力。
分析确定了两个阶段：从干净样本的初步学习和随后对噪声样本的过拟合。
标签噪声影响卷积神经网络的训练动态，挑战其特征学习过程。
像提前停止这样的技术可以帮助管理深度学习中标签噪声的有害影响。

Abstract

带有噪声标签的深度学习面临重大挑战。在本研究中，我们从特征学习的角度理论上描述了标签噪声的作用。具体而言，我们考虑一个信号-噪声数据分布，在该分布中，每个样本包含一个依赖于标签的信号和一个独立于标签的噪声，并严谨地分析了在此数据设置下的双层卷积神经网络的训练动态，以及标签噪声的存在。我们的分析确定了两个关键阶段。在阶段 I 中，模型完美地拟合所有干净样本（即，没有标签噪声的样本），而忽略了噪声样本（即，有噪声标签的样本）。在这一阶段，模型从干净样本中学习信号，并在未见数据上具有良好的推广能力。在阶段 II 中，随着训练损失的收敛，噪声方向的梯度超过信号方向的梯度，导致对噪声样本的过拟合。最终，模型记住噪声样本中的噪声，降低了其推广能力。此外，我们的分析为两种广泛使用的应对标签噪声的技术提供了理论基础：提前停止和样本选择。在合成和真实世界的实验中验证了我们的理论。

标签噪声在特征学习过程中的作用

Key Points

Abstract

Cite This Study