题目:基础模型驱动的多模态行人检索与可控生成
报告人:叶茫
时间:2024年11月29日(周五),15:30-16:30
会议地点:31-904
报告摘要:
多模态行人检索在智慧城市等领域有重要应用,现有方法通常独立的去研究单一的跨模态检索任务,极大的限制了实际不确定场景的灵活性,本次报告将介绍如何利用多模态预训练模型,构建不确定多模态场景下的行人检索基础模型等相关工作,同时分享文本引导的可控人像生成相关研究进展及应用。
报告人简介:
叶茫,武汉大学教授,国家级高层次青年人才、中国科协青年托举人才。主要研究方向多媒体检索、多模态理解、联邦学习等,发表国际期刊会议论文 100 余篇,其中第一/通讯作者发表 CCF-A 类论文60余篇,谷歌学术引用近万次。担任CCF-A类期刊IEEE TIFS等SCI期刊编委,多次担任CVPR、ICLR、ACM MM、ECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021-2024斯坦福排行榜 “全球前2%顶尖科学家”、2022年度百度AI华人青年学者等荣誉。
中国·浙江 湖州市二环东路759号(313000) 浙ICP备10025412号 浙公网安备 33050202000195号 版权所有:党委宣传部