2024年信息工程学院学术报告之二十一

来源：信息工程学院发布日期：2024-11-18

　　题目：基础模型驱动的多模态行人检索与可控生成

　　报告人：叶茫

　　时间：2024年11月29日(周五)，15：30-16：30

　　会议地点：31-904

　　报告摘要：

　　多模态行人检索在智慧城市等领域有重要应用，现有方法通常独立的去研究单一的跨模态检索任务，极大的限制了实际不确定场景的灵活性，本次报告将介绍如何利用多模态预训练模型，构建不确定多模态场景下的行人检索基础模型等相关工作，同时分享文本引导的可控人像生成相关研究进展及应用。

　　报告人简介：

　　叶茫，武汉大学教授，国家级高层次青年人才、中国科协青年托举人才。主要研究方向多媒体检索、多模态理解、联邦学习等，发表国际期刊会议论文 100 余篇，其中第一/通讯作者发表 CCF-A 类论文60余篇，谷歌学术引用近万次。担任CCF-A类期刊IEEE TIFS等SCI期刊编委，多次担任CVPR、ICLR、ACM MM、ECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021-2024斯坦福排行榜 “全球前2%顶尖科学家”、2022年度百度AI华人青年学者等荣誉。

更多>>

湖师新闻

更多>>

2024年信息工程学院学术报告之二十一

湖师新闻

学术动态