视觉大模型插图

| 学术论坛-视觉大模型

基本信息

论坛形式:讲座
论坛时长:2小时
承办专委会:视觉大数据专委会
联合承办单位:Machine Intelligence Research(机器智能研究(英文))

论坛介绍

基于深度学习的大模型在计算机视觉领域上取得了重大突破。视觉大模型首先以无监督的方式在大规模训练集进行预训练,然后借助预训练模型的监督完成下游的视觉任务,已在多模态数据融合的感知、理解、生成等场景取得了卓越的性能。为了进一步梳理研究现状,讨论该领域的研究难点和发展趋势,本论坛邀请了多位学术界和企业界的资深专家,围绕迫切需要解决的问题,分享视觉大模型方面的理论方法和实践经验。

论坛主席

视觉大模型插图1

赫然
中国科学院自动化研究所

个人简介:赫然,研究员,博士生导师,国际模式识别学会会士(IAPR Fellow, 2020)。主要研究方向是模式识别、图像生成和生物特征识别,并应用到异质图像合成与识别、深度伪造与鉴别。担任IEEE T-IP、Patten Recognition和自动化学报等多个国内外期刊编委。在本领域国际主流期刊IEEE T-PAMI和IJCV上发表论文20篇,获IEEE信号处理协会最佳青年论文奖、ICPR最佳科学论文奖、北京青年优秀科技论文一等奖、CSIG自然科学一等奖。获国家优秀青年科学基金、北京杰出青年科学基金、国自然联合重点基金和中科院青年促进会优秀会员等项目支持。核心算法在国家重要领域的视频生成竞赛中获得第一名,已在军事、公安等国家重大任务以及华为智能手机、美团美食场景等民用领域得到大规模应用。

视觉大模型插图2

郑伟诗
中山大学

个人简介:郑伟诗博士,中山大学计算机学院教授、博导,现任中山大学计算机学院副院长、机器智能与先进计算教育部重点实验室副主任、大数据分析与应用技术国家工程实验室副主任。他致力持久研究(跨场景)行为感知信息,并结合多种模态信息,实现高层语义理解与推理。作为负责人,主持承担国家自然科学基金委联合基金重点项目、国家自然科学基金委优秀青年科学基金、国家重点研发课题、国家自然科学基金委联合重大项目课题、国防科技173计划基金等。获中国图象图形学学会自然科学奖一等奖、广东省自然科学奖一等奖、广东省自然科学奖二等奖等。

报告嘉宾

视觉大模型插图3

田奇
华为云

报告题目:盘古预训练大模型

讲者简介:田奇博士,现任华为云人工智能领域首席科学家。本科毕业于清华大学,博士毕业于美国伊利诺伊大学香槟分校(UIUC)。曾任德克萨斯大学圣安东尼奥分校(UTSA)计算机科学系正教授(2002-2019),清华大学神经与认知中心讲席教授。国家自然科学基金海外杰青,教育部长江讲座教授、中科院海外评审专家。主要研究方向为计算机视觉、多媒体信息检索、机器学习,曾获Google Faculty Research Award、UTSA校长杰出研究奖、多媒体领域10大最具影响力学者,发表660+篇国际期刊与会议论文,谷歌学术引用39600+, h-index 93。2018年加入华为,曾任诺亚方舟实验室计算视觉首席科学家。2016年当选IEEE Fellow, 2021年入选国家重大人才工程专家,2021年当选国际欧亚科学院院士。

视觉大模型插图4

文继荣
中国人民大学

报告题目:文澜多模态预训练模型的新进展

讲者简介:文继荣,教授,现任中国人民大学信息学院院长、高瓴人工智能学院执行院长。长期从事大数据和人工智能领域的研究工作,曾任微软亚洲研究院高级研究员和互联网搜索与挖掘组主任。到中国人民大学工作后,参与创立了高瓴人工智能学院,积极致力于推动人民大学人工智能和大数据的研究和教学,特别是新技术与人文社会科学的交叉。2013年入选国家“海外高层次人才计划”特聘专家,2018年入选首批“北京市卓越青年科学家”,2019年担任北京智源人工智能研究院首席科学家。

视觉大模型插图5

杨红霞
阿里巴巴达摩院

报告题目:走向下一代人工智能—认知智能的突破

讲者简介:杨红霞,美国杜克大学博士,阿里巴巴达摩院人工智能科学家。主导阿里下一代人工智能突破性技术-认知智能的技术发展与场景应用落地,发表顶级会议、期刊文章80余篇,美国和中国专利近20项。曾获2019世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称SAIL奖),2020年国家科学技术进步奖二等奖和杭州市领军型创新团队,2021年电子学会科学技术进步奖一等奖。加盟阿里前,曾任IBM全球研发中心Watson研究员, Yahoo!首席数据科学家。

视觉大模型插图6

王井东
百度

报告题目:Context Autoencoder for Scalable Self-Supervised Representation Pretraining

讲者简介:王井东是百度人工智能小组的首席计算机视觉科学家。他的团队专注于进行产品驱动和尖端的计算机视觉/深度学习/人工智能研究,并开发实用的计算机视觉应用程序。在加入百度之前,他是微软亚洲研究院的高级首席研究员。他的兴趣领域是计算机视觉、深度学习和多媒体搜索。他的代表作品包括深度高分辨率网络(HRNet)、用于监督显著性检测的判别区域特征集成(DRFI)、用于大规模相似性搜索的邻域图搜索(NGS、SPTAG)。他一直担任IEEE TPAMI、IJCV、IEEE TMM和IEEE TCSVT的副编辑,以及视觉、多媒体和人工智能领域领先会议的区域主席,如CVPR、ICCV、ECCV、ACM MM、IJCAI和AAAI。由于他对视觉内容理解和检索的贡献,他被选为ACM杰出成员、IAPR Fellow和IEEE Fellow。

论坛日程

8月20日下午

视觉大模型插图7