视觉大模型 - CCIG 2022

| 学术论坛-视觉大模型

基本信息

论坛形式：讲座
论坛时长：2小时
承办专委会：视觉大数据专委会
联合承办单位：Machine Intelligence Research（机器智能研究（英文））

论坛介绍

基于深度学习的大模型在计算机视觉领域上取得了重大突破。视觉大模型首先以无监督的方式在大规模训练集进行预训练，然后借助预训练模型的监督完成下游的视觉任务，已在多模态数据融合的感知、理解、生成等场景取得了卓越的性能。为了进一步梳理研究现状，讨论该领域的研究难点和发展趋势，本论坛邀请了多位学术界和企业界的资深专家，围绕迫切需要解决的问题，分享视觉大模型方面的理论方法和实践经验。

论坛主席

赫然
中国科学院自动化研究所

个人简介：赫然，研究员，博士生导师，国际模式识别学会会士（IAPR Fellow， 2020）。主要研究方向是模式识别、图像生成和生物特征识别，并应用到异质图像合成与识别、深度伪造与鉴别。担任IEEE T-IP、Patten Recognition和自动化学报等多个国内外期刊编委。在本领域国际主流期刊IEEE T-PAMI和IJCV上发表论文20篇，获IEEE信号处理协会最佳青年论文奖、ICPR最佳科学论文奖、北京青年优秀科技论文一等奖、CSIG自然科学一等奖。获国家优秀青年科学基金、北京杰出青年科学基金、国自然联合重点基金和中科院青年促进会优秀会员等项目支持。核心算法在国家重要领域的视频生成竞赛中获得第一名，已在军事、公安等国家重大任务以及华为智能手机、美团美食场景等民用领域得到大规模应用。

郑伟诗
中山大学

个人简介：郑伟诗博士，中山大学计算机学院教授、博导，现任中山大学计算机学院副院长、机器智能与先进计算教育部重点实验室副主任、大数据分析与应用技术国家工程实验室副主任。他致力持久研究(跨场景)行为感知信息，并结合多种模态信息，实现高层语义理解与推理。作为负责人，主持承担国家自然科学基金委联合基金重点项目、国家自然科学基金委优秀青年科学基金、国家重点研发课题、国家自然科学基金委联合重大项目课题、国防科技173计划基金等。获中国图象图形学学会自然科学奖一等奖、广东省自然科学奖一等奖、广东省自然科学奖二等奖等。

报告嘉宾

田奇
华为云

报告题目：盘古预训练大模型

讲者简介：田奇博士，现任华为云人工智能领域首席科学家。本科毕业于清华大学，博士毕业于美国伊利诺伊大学香槟分校（UIUC）。曾任德克萨斯大学圣安东尼奥分校（UTSA）计算机科学系正教授（2002-2019），清华大学神经与认知中心讲席教授。国家自然科学基金海外杰青，教育部长江讲座教授、中科院海外评审专家。主要研究方向为计算机视觉、多媒体信息检索、机器学习，曾获Google Faculty Research Award、UTSA校长杰出研究奖、多媒体领域10大最具影响力学者，发表660+篇国际期刊与会议论文，谷歌学术引用39600+, h-index 93。2018年加入华为，曾任诺亚方舟实验室计算视觉首席科学家。2016年当选IEEE Fellow, 2021年入选国家重大人才工程专家，2021年当选国际欧亚科学院院士。

文继荣
中国人民大学

报告题目：文澜多模态预训练模型的新进展

讲者简介：文继荣，教授，现任中国人民大学信息学院院长、高瓴人工智能学院执行院长。长期从事大数据和人工智能领域的研究工作，曾任微软亚洲研究院高级研究员和互联网搜索与挖掘组主任。到中国人民大学工作后，参与创立了高瓴人工智能学院，积极致力于推动人民大学人工智能和大数据的研究和教学，特别是新技术与人文社会科学的交叉。2013年入选国家“海外高层次人才计划”特聘专家，2018年入选首批“北京市卓越青年科学家”，2019年担任北京智源人工智能研究院首席科学家。

杨红霞
阿里巴巴达摩院

报告题目：走向下一代人工智能—认知智能的突破

讲者简介：杨红霞，美国杜克大学博士，阿里巴巴达摩院人工智能科学家。主导阿里下一代人工智能突破性技术-认知智能的技术发展与场景应用落地，发表顶级会议、期刊文章80余篇，美国和中国专利近20项。曾获2019世界人工智能大会最高奖卓越人工智能引领者（Super AI Leader，简称SAIL奖），2020年国家科学技术进步奖二等奖和杭州市领军型创新团队，2021年电子学会科学技术进步奖一等奖。加盟阿里前，曾任IBM全球研发中心Watson研究员， Yahoo！首席数据科学家。

王井东
百度

报告题目：Context Autoencoder for Scalable Self-Supervised Representation Pretraining

讲者简介：王井东是百度人工智能小组的首席计算机视觉科学家。他的团队专注于进行产品驱动和尖端的计算机视觉/深度学习/人工智能研究，并开发实用的计算机视觉应用程序。在加入百度之前，他是微软亚洲研究院的高级首席研究员。他的兴趣领域是计算机视觉、深度学习和多媒体搜索。他的代表作品包括深度高分辨率网络（HRNet）、用于监督显著性检测的判别区域特征集成（DRFI）、用于大规模相似性搜索的邻域图搜索（NGS、SPTAG）。他一直担任IEEE TPAMI、IJCV、IEEE TMM和IEEE TCSVT的副编辑，以及视觉、多媒体和人工智能领域领先会议的区域主席，如CVPR、ICCV、ECCV、ACM MM、IJCAI和AAAI。由于他对视觉内容理解和检索的贡献，他被选为ACM杰出成员、IAPR Fellow和IEEE Fellow。

论坛日程

8月20日下午

| 学术论坛-视觉大模型

联系我们

会议秘书：罗老师

电话：028-87555888

手机：13688349945

中国图象图形学学会
联系人：骆老师、王老师
电话：010-82544676
邮箱: ccig@csig.org.cn