三码必今晚必中码三码一党委宣传部、新闻中心主办

2024年信息工程学院学术报告之二十一

来源:信息工程学院 发布日期:2024-11-18

  题目:基础模型驱动的多模态行人检索与可控生成

  报告人:叶茫

  时间:2024年11月29日(周五),15:30-16:30

  会议地点:31-904

  报告摘要:

  多模态行人检索在智慧城市等领域有重要应用,现有方法通常独立的去研究单一的跨模态检索任务,极大的限制了实际不确定场景的灵活性,本次报告将介绍如何利用多模态预训练模型,构建不确定多模态场景下的行人检索基础模型等相关工作,同时分享文本引导的可控人像生成相关研究进展及应用。

  报告人简介:

  叶茫,武汉大学教授,国家级高层次青年人才、中国科协青年托举人才。主要研究方向多媒体检索、多模态理解、联邦学习等,发表国际期刊会议论文 100 余篇,其中第一/通讯作者发表 CCF-A 类论文60余篇,谷歌学术引用近万次。担任CCF-A类期刊IEEE TIFS等SCI期刊编委,多次担任CVPR、ICLR、ACM MM、ECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021-2024斯坦福排行榜 “全球前2%顶尖科学家”、2022年度百度AI华人青年学者等荣誉。