近日,实验室2021级博士生秦者云一篇论文“Reformulating Graph Kernels for Self-supervised Space-Time Correspondence Learning”(作者:秦者云,卢宪凯,刘东方,聂秀山,尹义龙,沈建冰,Alexander C. Loui)被CCF A类、中科院一区期刊IEEE Transactions on Image Processing (TIP) 录用。TIP是国际人工智能计算机视觉顶尖和权威学术期刊之一,最新影响因子为10.86。
利用未标记视频的自监督时空对应学习在计算机视觉中具有巨大的潜力。 大多数现有方法依赖于对比学习,挖掘负样本或适应图像域的重建,这需要跨多个帧或光流约束的密集亲和力。 此外,视频对应预测模型需要揭示视频更多的固有属性,例如结构信息。 在这项工作中,我们提出了 HiGraph+,一种基于可学习图内核的时空对应框架。 通过将视频视为时空图,HiGraph+的学习目标以自监督的方式发布,通过图核方法预测未观察到的隐藏图。 首先,我们学习图级对应学习中子图的结构一致性。此外,我们通过对比学习引入了时空隐藏图损失,有助于学习子图帧之间的时间一致性和同一帧内的空间多样性。 因此,我们可以预测长期对应关系并驱动隐藏图获得不同的局部结构表示。 然后,我们通过密集的图核在节点级上学习跨帧的精细表示。 图的结构和时间一致性形成了模型训练的自监督范式。 HiGraph+ 在涉及对象、语义部分、关键点和实例标记传播任务的基准测试中实现了出色的性能并展示了鲁棒性。