我校计算机与大数据学院2024级计算机科学与技术博士生蔡家鑫于2025年6月赴美国纳什维尔参会,出访成果报告附后,现予以公示。公示时间从2025年6月25日起算,公示期为五个工作日。如有异议,敬请监督。 监督电话:22865580 校纪委(监察专员办)。
计算机与大数据学院
2025年6月25日
出访成果报告
出访人所在学院(或部门) |
计算机与大数据学院 |
领队姓名 |
蔡家鑫 |
出访人员名单(含领队) |
蔡家鑫 |
出访国家(地区) |
美国 纳什维尔 |
实际 出访时间 |
2025年6月10日 至2025年6月17日 |
实际往返路线(相关城市) |
福州长乐机场-上海浦东机场-底特律都会韦恩县机场-纳什维尔机场 纳什维尔机场-底特律都会韦恩县机场-上海浦东机场-福州长乐机场 |
出访任务 |
参加2025年IEEE国际计算机视觉和模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,CVPR),并作论文报告 |
出 访 成 果 报 告 |
2025年6月,我有幸赴美国纳什维尔参加 CVPR 2025(IEEE Conference on Computer Vision and Pattern Recognition),这是计算机视觉与模式识别领域最具影响力的国际会议之一。本届会议规模空前,共收到 13008 篇投稿,最终录用2872 篇(接收率约 22.1%),吸引了来自全球75个国家的9375名注册参会者。会议涵盖主会议、专题研讨会、短期课程等多种形式,为学术界与工业界提供了深度交流的平台。 在本次会议上,我作为第一作者汇报了团队的最新研究成果《Keep the Balance:A Parameter-Efficient Symmetrical Framework for RGB+X Semantic Segmentation》(保持平衡:用于RGB+X语义分割的参数高效对称框架)。该研究针对现有多模态语义分割研究的局限性,提出了一种参数高效的对称框架(Keep the Balance)用于RGB+X语义分割。我们的主要技术贡献包括:1. 设计了模态感知提示与适应模块,通过统一双模态特征、生成模态特定提示以及利用模态特定适配器,将预训练模型的能力同时适配到RGB和X模态,充分发挥X模态的潜力;2. 提出动态稀疏跨模态融合模块,通过在低秩空间中识别关键变形点、采样加权显著点并评估模态重要性,实现有效且高效的跨模态融合,减轻全局跨模态关联引入的噪声;3. 引入掩码模态自监督训练策略,通过随机掩码模态输入和利用双模态正确预测结果自监督单模态输出,增强模态特征增强和跨模态融合,减少模型对单一模态的依赖。 研究成果在Oral和Poster展示环节获得了广泛关注,多位专家学者对我们的创新方法表现出浓厚兴趣,并就模型优化、多模态扩展等方向提出了宝贵建议。会议期间,我还重点参与了多模态学习、视觉-语言大模型、具身智能等前沿方向的学习。通过与国际同行的深入交流,我注意到以下几个显著的研究趋势:1. 多模态学习研究向轻量化和可解释性方向发展;2. 3D视觉与神经渲染技术持续升温,在具身智能应用场景展现出巨大潜力。 此次CVPR之行收获颇丰,我们的学术成果不仅获得了国际同行的广泛认可,还收集到了诸多极具价值的建设性意见。展望未来,我们将充分吸收会议收获,进一步完善多模态模型,并积极探索跨领域合作机会,为推动计算机视觉技术的发展贡献力量。 该团组已进行事后公示。 (领队签字) |
遵守外事纪律情况(含意见和建议等): 严格遵守出访纪律。 |
|
|
|
|
|
|
|