近日,TIME实验室2019级硕士生刘新放一篇论文“Single-Shot Semantic Matching Network for MomentLocalization in Videos”被Transactions on Multimedia Computing Communications and Applications (TOMM) 期刊录用。
论文致力于解决如何根据自然语言从视频中查找对应事件片段这一难题,针对传统候选窗口方法和滑动窗口在效率上的不足,提出了一种单次轻量级的语义匹配网络(SSMN)。SSMN在具有很高的效率同时,对事件和视频的长度具有鲁棒性。另外,论文还设计了一种跨模态注意力模块。
TOMM是多媒体处理领域的权威期刊,属于CCF B类期刊。