近日,实验室博后孙皓亮一篇论文“Learning to Rectify for Robust Learning with Noisy Labels”(作者:孙皓亮,国晨晖,魏琦,韩忠义,尹义龙)被模式识别顶级期刊Pattern Recognition所接收。
在神经网络训练中,标签噪声会显著降低模型的泛化能力。当前有效的策略和方法(重加权或损失校正),旨在减轻训练神经网络时标签噪声的负面影响。这些现有的工作通常依赖于预先指定的架构和手动调优额外的超参数。在本文中,我们提出了扭曲概率推理(WarPI)来实现训练过程的自适应校正用于元学习场景中的分类网络。与确定性模型相比,WarPI是通过学习一个摊余元网络建立的分层概率模型,可以解决样本歧义,因此对严重的标签噪声具有更强的鲁棒性。与现有的直接从损失中生成权重值的近似加权函数不同,我们的元网络学习从对数和标签的输入中估计一个校正向量,这有能力利用它们中的充分信息。该方法为分类网络的学习过程提供了一种有效的修正方法,证明了泛化能力的显著提高。此外,将校正向量建模为潜在变量,学习元网络,可以无缝集成到分类网络的SGD优化中。我们在带噪声标签的鲁棒学习的四个基准上评估了WarPI,并在不同的噪声类型下实现了新的最先进的技术。大量的研究和分析也证明了我们的模型的有效性。