报告时间:2024年11月20日(周三)9:30 – 11:00
报告地点: 计算机与大数据学院2-219会议室
报告题目:Foundation Models Meet Novel Class Recognition
报告简介:虽然深度学习在计算机视觉领域取得了显著突破,但在包含未知类别的开放场景中,仍然面临重大挑战。为了解决这一问题,近年来,异常类别检测和新类发现等领域受到了广泛关注。同时,近年来大模型的突破性进展极大推动了多个领域的发展,尤其是在零样本学习、图文生成、图像描述和图文推理等任务中表现突出。这引发了一个关键问题:大模型能否有效应用于或辅助异常类别检测和新类发现任务?本次汇报将介绍两种利用大模型支持异常类别检测和新类发现的方法:1)通过大语言模型生成未知类别信息,无需额外训练样本即可显著提升异常类别检测性能;2)通过视觉-语言模型的交互,构建具有语义可解释性的新类发现框架,为未知类识别任务在大模型时代提供了新的思路和方向。
报告人介绍:钟准,现任合肥工业大学教授,博士生导师,入选国家级青年人才计划。钟博士于2019年在厦门大学获得工学博士学位,博士期间同时为悉尼科技大学联合培养博士。先后在意大利特伦托大学和英国诺丁汉大学从事博士后和助理教授工作。主要研究以可信计算机视觉为主题,在计算机科学领域发表高水平论文50余篇,包括T-PAMI, IJCV, AIJ, CVPR, ECCV, ICCV, NeurIPS, ICLR, ICML,谷歌学术引用超过10,000次,其中两篇第一作者论文引用次数分别超过4,000次和1,800次,并且其中一篇被PaperDigest评为2020年最具影响力AAAI论文(排名第一)。连续三年入选斯坦福全球前2%顶尖科学家榜单以及AI 2000最具影响力(新星)学者提名。担任顶级会议CVPR, ECCV, ICML, NeurIPS, ICLR, ACM MM领域主席以及顶级期刊IJCV客座编委和CVIU编委。