近日,实验室2020级博士生王任一篇论文“Multi-View Representation Learning via View-Aware Modulation”(作者:王任,孙皓亮,聂秀山,林毓秀,袭肖明,尹义龙)被CCF A类会议ACM-MM录用。ACM MM是新媒体领域的顶级会议,属于CCF A类会议。
多视图表示学习从实体的多个可观测视图中学习统一的实体表示,有利于促进分类,聚类,检索和识别等基本任务的性能。由于实体自身不可观测性和视图间的异构性,现有方法设计策略直接融合多视图特征的方式难以捕捉“实体-视图”的真实关系,影响学到统一表示的质量。本文从模型代理和参数调制的角度提供了一种新的多视图表示学习方法。通过定义和约束参数的唯一性,表示性和简单性,我们为实体和各个视图绑定对应的模型参数,称为代理(proxy)模型。另外,通过设计一个视图感知的调制参数生成器,从实体代理中调制得到视图代理。调制的过程在参数层面显式建模了真实的“实体-视图”关系,同时在表示层面将其与样本相关信息解耦,提高了习得统一表示的质量。在分类和聚类任务上的实验结果验证了调制和代理思路的有效性。