新闻动态

新闻动态 当前位置: 首页 >> 新闻公告 >> 新闻动态 >> 正文

恭喜TIME实验室何润东博士一篇论文被机器学习顶会ICLR录用

发布日期:2025-01-23作者:点击:

近日,TIME实验室何润东博士一篇论文“Re-Evaluating the Impact of Unseen-Class Unlabeled Data on Semi-Supervised Learning Model”(作者:何润东,董奕聪,郭兰哲,尹义龙,吴泰霖)被人工智能领域顶级会议International Conference on Learning Representations (ICLR)录用ICLR是深度学习领域最具影响力的会议之一,每年的会议都会展示大量前沿的研究成果,对学术界和工业界的影响深远。ICLR属于清华大学推荐人工智能A类,和ICML、NeurIPS并称为机器学习领域三大顶级会议。

半监督学习(SSL)是一种能够有效利用未标注数据的技术,广泛应用于图像分类、自然语言处理等领域。然而,未标注数据中可能包含“不可见类”(即模型未见过的类别),长期以来被认为会对SSL模型的性能造成负面影响。传统研究通过改变未标注数据中不可见类的比例来评估其影响,但这一方法同时改变了已见类的比例,违背了控制变量的原则,导致评估结论可能存在偏差。本文的创新点主要体现在以下几个方面:首先,首次指出以往关于不可见类对SSL模型影响的评估存在缺陷,并通过构建结构化因果模型深入分析导致这些缺陷的根本原因;其次,提出了全新的评估框架RE-SSL,涵盖评估因素设定、数据集构建、对比方法选择、鲁棒性评估指标制定及实验结果分析,系统优化了评估流程;再次,首次从样本数量、类别数量、类别索引、邻近性和标签分布五个关键维度全面研究不可见类对SSL模型的影响;此外,基于全局和局部鲁棒性,设计了五个评估指标,为分析不同因素下不可见类的影响提供了更直观有效的工具;最后,通过公平合理的实验设计和详细结果分析,验证了不可见类对SSL模型的实际影响,并为含不可见类的应用场景提供了强有力的理论支持和实践指导。