报告时间:2025年1月4日(周六)16:00 – 17:00
报告地点:计算机学院2号楼219会议室
报告题目:面向视觉-语义关联学习的多模态预训练模型知识增强
报告简介:近年来,在探索通用人工智能的可能发展方向中,多模态大模型已成为当前备受关注的重要方向,受到了学术界和工业界的广泛关注。多模态大模型的研究任务涵盖多模态问答和推理、图文生成、图像理解与推理等各个多个方面的内容。本报告着重介绍了研究团队在面向视觉-语义关联学习的多模态预训练模型知识增强方面的研究工作,围绕外部知识和内部知识两个方面开展了多模态预训练大模型与下游视觉-语义关联学习任务的适配问题研究,重点介绍基于多模态预训练大模型的小样本识别、图像理解、视觉问答、语义分割、图像检索、视觉定位等下游任务的适配工作,最后介绍在实际业务上的应用情况。
报告人介绍:李泽超,南京理工大学计算机科学与工程学院/人工智能学院/软件学院教授、副院长,研究兴趣主要是多模态智能分析、计算机视觉等,主持国家杰出青年科学基金,新一代人工智能国家科技重大专项课题、国家自然科学基金联合基金重点项目、江苏省攀登项目、江苏省杰青项目等;入选国家“万人计划”青年拔尖人才;发表CCF A类期刊和会议论文70余篇;获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项;获得ACM MM Asia 2020和2024两年度最佳论文奖等;担任IEEE TPAMI, TNNLS, TCSVT等期刊编委。