近日,实验室教师宫永顺一篇论文“Missingness-pattern-adaptive Learning with Incomplete Data”(作者:宫永顺,李志滨,刘伟,卢宪凯,刘新旺,Ivor W. Tsang,尹义龙)被IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 录用。TPAMI是人工智能顶尖期刊,是中国计算机学会(CCF)推荐的人工智能领域A类期刊,是中科院一区TOP期刊,最新影响因子(IF)为24.31。
现实世界中的许多任务面临数据缺失的问题,例如RNA序列分析、图像补全、视频处理等。通常,此类数据缺失严重阻碍了模型的学习结果。现有的大多数方法倾向于对所有不完整的数据使用一种通用模型,从而对每个缺失模式产生次优模型。在本文中,我们提出了一个针对不完全数据学习的通用自适应模型。所提出的模型可以根据不同的缺失模式进行适当调整,缓解学习过程中数据之间的竞争。我们的模型仅基于可观察到的数据特征,因此不会引入因数据补全而产生的误差。之后,我们进一步引入了一个低秩约束来提高模型的泛化能力。对泛化误差的分析从理论上证明了所提出模型的优势。此外,还提出了一种亚梯度更新策略来优化我们的模型,并证明了该方法的收敛性。在不同类型数据中的实验表明,对于不完整数据,我们的方法与典型的插补策略和其他最先进的模型相比是有明显优势的。更重要的是,所提出的方法可以无缝地融入神经网络,并获得最佳结果。