新闻动态

新闻动态 当前位置: 首页 >> 新闻公告 >> 新闻动态 >> 正文

祝贺TIME实验室博士生李文浩一篇论文被CCF-A类会议NeurIPS录用

发布日期:2025-09-19作者:点击:

近日,TIME实验室2025级博士生李文浩一篇论文“VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning” (作者:李文浩,王强昌,孟宪静,吴志宾,尹义龙)被Annual Conference on Neural Information Processing SystemsNeurIPS2025会议录用。NeurIPSICMLICLR并称“机器学习三大顶会”,属于CCF A类会议。

小样本学习(Few-shot Learning, FSL)旨在使模型仅凭少量标注样本就能识别新概念。目前的方法通过引入额外语义信息(如类别描述)或设计复杂的语义融合模块来提升效果,但仍易遭受“语义幻觉”,即模型生成的语义与视觉证据相矛盾,造成噪声和高昂的修正成本。为此,本研究提出了全新的 VT-FSL 框架,利用大语言模型(LLMs)和支持图像构建精准的跨模态提示,并通过几何感知的对齐机制实现无缝整合。首先跨模态迭代提示(CIP)中,在类别名称和支持图像的条件下,LLM 通过单次系统和结构化的CoTChain-of-Thought)推理过程迭代生成精确的类别描述,并支持零样本合成语义一致的图像。这些描述与合成图像作为互补的文本和视觉提示,提供高级类语义和低级别类内多样性以补偿有限的支持数据。此外,跨模态几何对齐(CGA)通过最小化三维超平行体的核化体积,联合对齐文本、支持样本与合成图像的表示,捕捉全局和非线性的关系,从而实现结构化和一致性的多模态整合。该方法在涵盖标准、跨域和细粒度3个不同的FSL场景共10个基准上均实现了最先进的性能。