南京邮电大学鲍秉坤教授作高水平学术前沿讲座
2024年5月16日,南京邮电大学计算机学院、软件学院、网络空间安全学院副院长鲍秉坤教授受邀访问我系,在中国科学技术大学高新校区图书教育中心GT-C101做了题为“跨模态图像生成”的高水平学术前沿讲座。本次讲座由陈雪锦教授主持。
在该报告中,鲍秉坤教授首先介绍了跨模态图像生成的研究进展,指出了尽管现有研究在生成图像的质量方面取得了一定的进步,但生成图片的速度较慢,且对硬件需求较高。这主要归因于当前预训练生成模型具有庞大的参数规模,生成过程高度复杂,每个生成步骤都需要进行大量计算,从而导致整个生成过程耗时相当长。这一缺陷使得模型训练成本极高,同时也提高了用户的硬件和时间成本。
鲍秉坤教授随后从提高预训练GAN模型生成质量且保证生成速度的角度出发,介绍团队在文本生成图像任务的研究思路和研究成果,具体包括深度融合生成架构DF-GAN,生成对抗预训练大模型GALIP,特定域的图像生成模型CookGALIP和多场景时序图像生成模型CoIn。最后鲍秉坤教授探讨如何使用大规模预训练多模态模型优化文本到图像生成任务。
讲座的最后,鲍秉坤教授与在场师生进行了深入的交流,并鼓励在场师生积极参与和贡献于人工智能在科学领域的研究。讲座在热烈的掌声中圆满结束。
报告人简介:鲍秉坤,南京邮电大学计算机学院、软件学院、网络空间安全学院副院长(主持工作),教授、博士生导师。国家杰出青年基金获得者、中组部万人计划-青年拔尖人才、江苏省杰青、江苏省双创人才。研究方向为多媒体计算、社交多媒体、计算机视觉、人工智能等。先后主持多项国家和省部级项目,包括国家重点研发计划:科技创新2030-人工智能重大专项、国家自然科学基金重点项目、国防科技173计划技术领域基金项目、江苏省重点研发计划等。荣获2018年度电子学会科学技术(自然科学类)一等奖。荣获多媒体领域的ACM汇刊TOMM 2016年度最佳论文奖、IEEE MM 2017年度最佳论文奖、Multimedia Modeling 2019年度最佳论文Runner Up奖。荣获ICME 2020 Outstanding Areas Chair。