近日,实验室2021级博士生何润东一篇论文“Safe-Student for Safe Deep Semi-Supervised Learning with Unseen-Class Unlabeled Data”(作者:何润东,韩忠义,卢宪凯,尹义龙)被CVPR2022会议录用。CVPR是国际计算机视觉顶尖和权威学术会议之一,属于CCF A类会议。
深度半监督学习(Deep semi-supervised learning, SSL)方法旨在利用大量的无标记数据来提高算法性能。在本文中,我们考虑了安全SSL场景,即在无标签数据中出现不可见类的实例的问题。这种场景经常出现在各种实际应用中。一种直观的解决方案是在SSL过程中检测到这些不可见类的实例后去除它们。然而,不可见类识别的性能受到标记数据数量较少的限制,并且忽略了未标记数据的可用性。为了利用这些不可见的类数据并确保性能,我们提出了一种安全的SSL方法。该方法从teacher-student角度出发,我们称之为SAFE-STUDENT。首先,提出了一种新的得分函数(energy-discrepancy, 检测ED)来帮助teacher模型提高实例选择的安全性。然后,提出了一种新的不可见类标记分布学习机制,通过校准不可见类标记分布来缓解不可见类的扰动。最后,我们提出了一种促进teacher和student模型学习的迭代优化策略。在几个具有代表性的数据集上的研究表明,SAFE-STUDENT的性能显著优于目前的技术水平,验证了我们的方法在待探索的问题上的可行性和鲁棒性。