企业论坛
AI时代,飞桨助力图象图形技术的实践与探索论坛
基本信息
论坛形式:研讨会
论坛时长:2小时
承办单位:北京百度网讯科技有限公司
论坛介绍
图象图形技术作为人工智能领域一项基础性、普适性技术,近年来呈现出迅猛的发展趋势。在面向现有业务及场景视频化发展激烈竞争的当下,如何从底层技术革新、优化业务逻辑;未来从生产到消费图象图形在哪些新的业务、产品及场景下能够创造更多新的价值是我们迫切需要思考的问题。
本次活动聚焦图象图形技术在体育、医疗、教育、制造等场景的最新探索与应用实践,集聚百度专家、行业大咖、高校学者共话技术创新与发展新思路,为与会学者提供开源开放的深度学术交流平台。
论坛主席
王井东
北京百度网讯科技有限公司
个人简介:王井东,2001和2004年在清华大学自动化系先后获得学士学位和硕士学位,2007年在香港科技大学计算科学与工程系获得博士学位。2007年进入微软亚洲研究院,现任百度计算机视觉首席架构师。2018年,当选国际计算机学会2018年度杰出科学家。2021年入选美国电气和电子工程师协会(IEEE)Fellow。
报告嘉宾
胡晓光
百度
讲者简介:百度深度学习技术平台部杰出研发架构师,有10多年的深度学习算法和框架工程研发实践经验。2015年带领团队研发全球首个基于深度学习的在线翻译引擎。现负责国内首个开源深度学习框架飞桨的核心技术研发,设计了飞桨框架2.0全新的API体系,形成了飞桨API动静统一、高低融合的特色;研发飞桨高阶自动微分机制,并结合编译器和分布式训练技术更高效地支持科学研究和产业应用。牵头研制了飞桨产业级开源模型库,包括计算机视觉领域的PaddleDetection、PaddleOCR等产业级开发套件,建设产业级深度学习开源开放平台,并实现大规模产业应用。曾获国家科技进步二等奖1项,省部级科技进步一等奖3项。
报告题目:飞桨框架核心技术与计算机视觉应用实践
报告摘要:飞桨是我国首个自主研发的产业级开源深度学习平台,其架构具备灵活、高效的特性。本报告介绍飞桨框架的核心设计思想及其在计算机视觉领域的应用实践,包括飞桨整体介绍、特性、计算机视觉产业级模型库、产业应用案例等方面的内容。帮助开发者更好地使用飞桨框架去解决计算机视觉领域的问题,加速AI技术从前沿研究到产业应用的过程。
卢飞翔
百度
讲者简介:卢飞翔,百度研究院资深研究员,博士毕业于北航虚拟现实技术与系统国家重点实验室。研究方向包括:三维重建、语义建模、场景理解、数据增强,以及三维视觉技术在智慧体育以及机器人领域的应用。相关工作发表于:Science Robotics,T-PAMI,ACM TOG,CVPR,ICCV,AAAI等,获得计算机图形学国际会议CGI 2018 Best Paper Award。作为技术负责人主导的百度与中国跳水队合作项目——“3D+AI跳水训练系统”被新华社、人民日报、CCTV、国家体育总局官网等权威媒体宣传与报道。
报告题目:“3D+AI”智慧体育的落地与实践
报告摘要:科技是助力体育事业发展的翅膀,国内外体育已迎来了拥抱科技的大趋势,未来体育运动将全面进入智能时代。这篇报告将分享百度飞桨在智慧体育的两个落地案例。首先,百度基于“3D+AI”技术,为中国跳水队打造国内首个“云-边-端”软硬一体的体育训练系统,从时间和空间维度,突破体育运动定量评价与数据分析的难题,让体育训练更加科学、智能、合理、有效。其次,面向北京冬奥会,百度助力央视总台《奥秘无穷》和《荣誉殿堂》两档节目制作,打造体育类节目新的呈现形式。通过“3D+AI+XR”技术,通俗化拆解运动规则,呈现运动细节,创新观赛体验,助力赛事分析,让科技更好得为冰雪运动助力。
许言午
百度
讲者简介:许言午博士,百度智慧医疗科学家,WHO数字健康咨询委员会专家,中国科学院慈溪医工所客聘研究员,新加坡眼科研究所客聘研究员,IEEE高级会员,中国生物医学工程学会科技创新与产业促进工作委员会委员,全国智能眼科分会常委。自2004年起,他持续从事计算机视觉、机器学习理论及其应用研究,共发表了120余篇国际期刊及会议论文,谷歌引用4700余次,申请国际专利20多项和中国专利60多项。他目前担任医疗影像顶会MICCAI和IPMI组委,Springer Nature旗下Medical Imaging和BioMedical Engineering Online期刊编委,中华医学会主办“中国科技期刊卓越行动计划”英文期刊Intelligent Medicine创刊编委,AAAI、ACPR、ACCAS等国际学术会议组委及PC委员,眼科医学影像国际会议OMIA和国际比赛平台iChallenge创始主席。他先后获聘公安部引智计划特聘专家、浙江省特聘专家、北京市特聘专家。
报告题目:眼底影像人工智能研究中的小数据挑战
报告摘要:相对于现在NLP和CV 领域热门的大模型研究,缺乏高质量的标注数据一直是医学影像(Medical Imaging)研究领域的瓶颈。报告人将结合自己十多年眼科医学影像的研究,介绍怎样利用小数据进行科研探索和怎么克服小数据进行真实落地应用研发的困境。类似原始影像的缺乏,即便有大量“脏”数据,高质量的有效标注缺乏也可以类比解决。希望本报告可以给听众们提供一些思路和真实的案例参考。
章成全
百度
讲者简介:章成全,百度视觉技术部资深研发工程师,是百度OCR算法负责人,支持公司多个关键业务包括百度智能云OCR系列产品。自2016年加入百度视觉团队后,专注于OCR检测和识别、文本图像编辑、以及文档图像结构化理解等前沿算法和应用研发工作。相关工作发表于顶级会议或期刊超10篇,多次取得OCR国际权威赛事冠军,并且获得多项国内外授权专利和1项第23届国家专利银奖。此外,带领团队建设行业领先的OCR产品矩阵并获得信通院的“增强级”产品认证, 以及首届人工智能竞赛唯一“印刷文本OCR”A级证书。
报告题目:OCR图像智能理解技术和产业规模化落地
报告摘要:人类的生产生活已经进入了信息爆炸时代,在漫无边际的海量数据中,文字是信息交互最为重要的载体,广泛存在于文档、街景照片、网络图片和长短视频等媒介中。如何让机器从各种复杂场景图像中提取结构化OCR信息,已经成为了人工智能时代聚焦的基础技术能力。本报告将分享百度OCR面向复杂场景下语义化文字识别和结构化理解的解决方案,具体地包括高效利用大规模无标签图像和文本语料自监督学习的文字识别大模型和面向小数据、版式复杂的文档结构化预训练方案,以及能规模化帮助各行各业进行数字化升级的OCR自训练平台。
黄进
西南交通大学
讲者简介:黄进博士,副教授,硕士生导师。现任西南交通大学&百度飞桨人工智能联合创新实训室主任,西南交通大学&华为技术有限公司机器视觉联合实验室主任,西南交通大学中国土地信息大数据研究院院长,主要研究领域为图像处理与计算机视觉、深度学习与人工智能。编著《数字图像处理原理与实现》书籍一部,主持或参与省部级各类纵向项目十余项,主持横向项目二十余项,国内外期刊发表学术论文十余篇,授权发明专利十余项,在农业农村、自然资源、文化旅游、教育住建等领域实现十余项人工智能科研成果的技术转化和工程应用,实现成果转化经费1千余万元,主办或主讲人工智能技术政府培训或论坛讲座三十余场次,涉及管理干部或技术骨干7000余人。获成都市科技局科技人才创新创业项目资助,国家级教学成果奖二等奖、四川省教学成果奖一等奖等。
报告题目:基于百度飞桨的中考实验操作考试智能评分技术及应用
报告摘要:教育部2019年发布“关于加强和改进中小学实验教学的意见”,明确要求将中考物理、化学和生物实验操作考试成绩纳入中考成绩。为解决监考师资需求量大、操作过程复现性难、评价结果主观性强等难题,基于人工智能的实验操作考试评分成为确保中考公平公正、高质高效组织实施的重要手段。基于中考实验操作考试实验数量多、仪器类型多样、仪器型号复杂、实验步骤严谨、操作细节精准、操作主观性强等特点,智能评分涉及大规模数据集构建、机器视觉模型、自然语言处理,以及模糊多粒计算、跨域迁移学习、多模数据融合等人工智能技术,采用百度飞桨很好地解决了相关技术问题,并取得了良好的市场效益。
杨瑞
武汉大学人民医院
讲者简介:杨瑞,武汉大学人民医院主治医师,医学博士。曾赴中科院深圳先进技术研究院医工所交流学习。擅长泌尿系结石的微创治疗,主要研究方向为人工智能在泌尿外科领域的应用。参与国家自然科学基金项目4项,省部级项目多项。发表SCI4篇,中文核心文章多篇。获批实用专利2项,发明专利一项。
报告题目:深度学习在膀胱肿瘤诊断中的应用的探索
报告摘要:介绍利用飞桨构建的膀胱肿瘤识别模型和利用Edgeboard在临床进行验证的情况。
胡文锐
成都国铁电气设备有限公司
讲者简介:成都国铁电气设备有限公司研发总监。
报告题目:基于图像视频的轨道交通智能巡检应用
报告摘要:为了替代人工巡检,实现轨交基础设施的高效智能化运维,我们利用深度学习技术,对多个实际业务场景中采集的接触网、受电弓、轨道、隧道巡检视频图像进行缺陷智能检测,从而达到轨交运维提质增效的目的。
论坛日程
8月19日下午
华为昇思MindSpore技术论坛
基本信息
论坛形式:研讨会
论坛时长:2小时
承办单位:华为技术有限公司
论坛介绍
昇思MindSpore是华为开源的新一代全场景AI框架,支持端、边、云全场景灵活部署,开创全新的AI编程范式,降低AI开发门槛,旨在实现开发友好、运行高效、部署灵活三大目标,同时着力构筑面向全球的人工智能开源社区,推动人工智能软硬件应用生态繁荣发展。
论坛主席
堵俊平
华为技术有限公司
个人简介:华为计算开源总经理,开放原子开源基金会TOC主席,LF AI & DATA基金会董事主席,Apache软件基金会Member。在开源领域深耕十数载,是Hadoop, Ozone,YuniKorn等大数据与AI领域明星开源项目的PMC与Committer。目前在华为主要推动AI及操作系统领域的开源项目,也是“开源雨林”计划的主要发起人。
报告嘉宾
于璠
华为技术有限公司
讲者简介:中国科学技术大学计算机博士毕业,华为工作12年,现任华为软件领域科学家/副首席专家/昇思MindSpore架构师,获得2020OSCAR开源人物,获聘哈尔滨工业大学客座教授,主导华为AI系统核心算法/云计算资源调度/SDN大规模路由等架构和算法的设计和落地,发表专利和论文40余篇。
报告题目:AI科学计算业界进展和MindSpore实践
报告摘要:AI在计算机视觉、自然语言处理等领域已取得一定成功,其影响已扩展至科学和工程等诸多领域。AI在蛋白质结构预测、分子模拟、流体气象以及微分方程求解等传统科学领域已取得革命性的突破,如AlphaFold2在蛋白质结构预测中取得了媲美实验的精度。传统科学领域悄然成为了AI新的主战场,AI for Science是科学计算的新范式。昇思MindSpore从创立之初便积极布局,不仅提供了AI科学计算的软件基础底座,还投入研发电磁、材料、制药、航空航天四大套件。本次演讲将与大家分享AI科学计算的业界趋势、进展以及MindSpore的实践等内容,期待与大家进行一次思维的碰撞。
胡晓曼
华为技术有限公司
讲者简介:胡晓曼,华为MindSpore开源生态总监,LFAI & DATA Outreach委员会主席,中国电子学会专家,TinyMS开源项目负责人,2021中国开源先锋。MSG·Women In Tech 组织创始人,华为科技女性代表人之一。曾任算法专家,负责计算机视觉和分布式深度学习框架项目。
报告题目:基于MindSpore和KubeEdage的卫星增量深度学习
报告摘要:本议题将介绍如何将MindSpore深度学习框架与KubeEdge Sedna(云原生边缘机器学习套件)结合,在卫星上实现增量学习已完成遥感和观测地球等任务的方案,适用于轨道地球协调图像推理、增量深度学习和联合学习等新服务场景。
谢治宇
成都考拉悠然科技有限公司
讲者简介:电子科技大学学士,10年研发及架构经验,曾主导研发了城市级AIoT平台,丰富的架构能力及解决方案能力。
报告题目:基于MindSpore构建的码极客AI中台赋能超大城市治理场景化应用
报告摘要:超大城市治理的未来发展趋势必将是智治能力中台化,通过基于MindSpore构建的码极客AI中台将人工智能能力集约管控,实现从数据出发,通过模型和算力打造场景化AI能力,在业务场景中产生价值,促进超大城市的数智化发展进程。
邵杰
电子科技大学
讲者简介:邵杰,2014年起任电子科技大学计算机科学与工程学院教授、博导,兼任四川省人工智能研究院(宜宾)常务副院长。在多媒体、大数据等方向发表高水平学术论文百余篇。在DASFAA 2012国际会议上获最佳论文奖,在PCM 2017国际会议上获最佳论文提名奖。主持和承担国家自然科学基金面上项目、重点项目,科技部科技创新2030—新一代人工智能重大项目,四川省重点研发项目、新一代人工智能重大科技专项,以及腾讯、华为、铁道科学研究院等企业委托项目。2019年担任CCF大数据领域推荐国际会议APWeb-WAIM的程序委员会主席。获2021年四川省科技进步二等奖。
报告题目:基于地理定位问题的交叉视图匹配方法
报告摘要:基于地理定位问题的交叉视图匹配,是从不同的平台上检索出最相关的图像,来预测查询图像的实际空间位置,从而进行定位。我们将分别介绍基于无人机-卫星的交叉视图地理定位和基于地面-卫星视图的地理定位方法,以及基于MindSpore的算法实现。
论坛日程
8月19日下午
“发现未来”-沉浸式业务论坛
基本信息
论坛形式:研讨会
论坛时长:2小时
论坛介绍
在未来网络时代,全息结合6G、AI、大数据等技术,将构建多元智能体,实现物理世界与数字世界的有机整合与多向互动 ,打造“虚实融合、延伸时空、具身交互,面面交流”的未来业务。 同时伴随元宇宙的发展,“数字孪生+AI+全息”的共融共通将提供更深层次的沉浸式自然交互体验,本论坛旨在联合产业界、学界共同探索未来的全息通信等沉浸式业务形态,推动行业的共同发展,论坛由中国移动通信有限公司同北京图象图形协会联合承办,邀请了产业界学术界的专家和大家就未来业务前沿技术及应用进行深入交流。
论坛主席
魏晨光
中国移动研究院
个人简介:魏晨光,现任中国移动研究院副院长,5G+视频彩铃产业联盟理事,CUVA超高清视频产业联盟(CUVA)理事,5G多媒体创新联盟(5MII)理事。先后任职于中国移动通信集团技术部科技处副处长、处长、副总经理。主导中国移动集团公司科技创新体系建设,构建研发项目管理、标准管理、成果管理的管理制度和流程,推动中国移动科技创新实力稳步提升。近年来在中国移动研究院分管业务领域、战略市场领域研发工作,带领团队研发超级SIM、5G消息、5G新通话、大视频、车联网等关键技术与产品。
喻炜
中国移动研究院
个人简介:喻炜,现任中国移动研究院业务研究所所长,中国移动集团公司科协智慧家庭学部专家,5G+视频彩铃产业联盟专家组组长,国家版权局网络版权保护研究基地专家委员会专家,ECC产业联盟边缘计算视觉基础设置工作组主席。先后任职于北京邮电大学计算机学院副教授,中国移动研究院科技管理部副总经理、总经理。长期从事移动通信网、互联网网络与业务技术的教学、研究及开发工作,2014年入选国家知识产权局领军人才。
报告嘉宾
宋爱国
东南大学
报告题目:虚拟现实的力触觉交互技术研究
讲者简介:宋爱国,东南大学首席教授,国家杰出青年基金获得者、中国青年科技奖获得者、全国优秀科技工作者,入选国家百千万人才工程和国家“万人计划”。长期从事机器人传感与遥操作人技术、人机交互与虚拟现实技术、空间机器人技术、助老助残康复机器人技术的研究。1996年3月在东南大学仪器科学系获得博士学位,1998年2月评为副教授,2000年4月评为教授。2004年5月至2019年12月为东南大学仪器科学与工程学院院长;现为东南大学电气仪器控制学部主任、空间科学与技术研究院执行院长、生物电子学国家重点实验室副主任、机器人传感与控制技术研究所所长。作为项目负责人先后主持国家重点研发项目1项、国家863项目10项、国家973课题1项、国家自然科学基金重点项目3项与面上项目6项、载人航天预研项目6项等重要课题60余项。作为第一完成人先后获国家技术发明二等奖1项、教育部技术发明一等奖2项、江苏省科技进步一等奖2项、吴文俊人工智能科技进步一等奖1项、中国仪器仪表学会科技进步一等奖1项、中国专利优秀奖2项,以及省部级科技进步二等奖3项、日内瓦国际发明金奖5项等。发表论文300余篇,其中SCI论文260余篇,被SCI他引3000余次;获发明专利授权100余项;编制特种机器人国家标准5项。现任国务院学位委员会仪器科学与技术学科评议组成员,中国仪器仪表学会常务理事、中国计量测试学会常务理事、全国误差理论与不确定度研究会理事长,中国力触觉感知与交互专业委员会主任等。
桑新柱
北京邮电大学
报告题目:裸眼3D光场显示
讲者简介:桑新柱,1977年生,北京邮电大学二级教授,博士生导师,信息光子学与光通信国家重点实验室团队责任教授,空间机器人技术教育部重点实验室副主任。北京邮电大学和香港城市大学光电子研究中心联合培养博士,国防科技大学博士后,2007年7月-2008年7月在美国加州大学尔湾分校从事博士后研究。2011年入选北京市科技新星和教育部新世纪人才支持计划,2021年获北京市科学技术奖科学技术进步奖一等奖(排名第1),2020年获中国产学研创新奖,2019年获教育部技术发明奖二等奖(排名第1)。近年来主要从事裸眼三维光场显示、智能信息处理、通信技术和新型光电子器件等方面的研究工作。作为项目负责人、主要研究人员承担国家自然科学基金项目、国家重点研发计划课题、国家973项目课题、国家“863”计划课题、教育部科学技术研究重点项目、北京市科技计划重点课题等20多项,和10余家科研机构和企事业单位开展项目和技术合作,部分成果实现了产业转化。以第1作者或指导研究生在“Optics Letters”、“Optics Express”、 “IEEE/OSA Journal of Lightwave Technology” “等国内外期刊和ICDT、OFC、CLEO等国际学术会议上发表学术论文200余篇,国际学术会议大会和邀请报告30多次,获得授权发明专利73项、软件著作权15项。
马思伟
北京大学
报告题目:沉浸媒体数据表示技术与标准
讲者简介:马思伟,北京大学信息科学技术学院教授,国家杰出青年科学基金获得者。主要研究方向视频处理与编码。自2002年起参与AVS系列国家标准的制定,担任AVS视频组长组织制定了新一代AVS3视频编码标准,研制的AVS2/AVS3超高清编解码器,支撑了央视CCTV-4K/CCTV-8K超高清频道的开播,推动了我国超高清电视广播应用及相关行业的发展。曾获国家技术发明奖一等奖、国家技术发明奖二等奖、国家科学技术进步奖二等奖等奖励。
徐枫
清华大学
报告题目:基于深度学习的交互运动感知与重建
讲者简介:徐枫,中国人工智能学会副秘书长,清华大学软件学院副教授,博士生导师,国家优秀青年科学基金,北京市杰出青年基金获得者。2007年于清华大学物理系获得理学学士学位、2012年于清华大学自动化系获得工学博士学位。2012年-2015年就职于微软亚洲研究院,先后任副研究员、研究员。2015年至今在清华大学任教。研究方向包括人工智能、智慧医疗、虚拟/增强现实等。近年来致力于三维重建、人工智能、大数据技术与医学、生命科学的交叉问题研究。相关工作发表在Cell Patterns,PRL,ACM Siggraph, ACM Siggraph Asia, CVPR等国际权威期刊和会议上。
李征
中国移动研究院
报告题目:全息通信业务
讲者简介:李征,博士,北京邮电大学信号与信息处理专业,高级工程师。现任中国移动研究院业务研究所副所长。曾任广东中山电信职员、西门子中国研究员、中国移动研究院业务所智能卡研究室主任。长期从事移动通信网、电子商务、互联网、安全芯片、安全计算、NFC等领域研究及开发工作。以第一作者,发表国际、国内学术论文十余篇,申请专利二十余项。国内最早手机NFC支付的研究人员,世博手机门票的开创者。获得国家金卡工程(二十五年)信息化开拓奖。
高雪松
海信数字多媒体技术国家重点实验室
报告题目:家庭大脑应用
讲者简介:高雪松,海信数字多媒体技术国家重点实验室副主任,国际标准化组织(ISO)和国际电工委员会(IEC)国际标准化工作组专家,全国信息技术标准化技术委员会人工智能分委会可信赖研究组副组长,AITISA新一代人工智能产业技术创新战略联盟AI标准专题工作组的隐私保护推进组长。从事人工智能和数据科学方面的研发工作,专注于跨媒体智能和隐私计算的研究与应用,主持和参与多项人工智能与隐私计算的国际标准制定,承担多项国家级和省市级重点研发计划重点项目,授权国家发明专利53件;2021年获得青岛拔尖人才称号;2020年获得吴文俊人工智能科技进步二等奖、青岛市科技进步二等奖、中国·山东(青岛)博士后创新创业成果大赛铜奖;2018年发布译作《Azure 机器学习》。
熊伟
凌云光技术股份有限公司
报告题目:虚实融合数字人
讲者简介:熊伟,中关村数智人工智能产业联盟数字人工作委员会副理事长。从事立体视觉拍摄系统研究与应用,牵头开发了三大系列、10余个子方向的自主立体视觉技术装备制作与交互软硬件系统,参与春晚、建党百年等多档电视节目及影视作品特效制作,于2021年被评为“中关村文化产业十大创新人才”荣誉。近几年主持参与了基于光场的真三维视频采集与生成、央视AI+VR裸眼3D技术等多个重大项目的开发,参与编写了我国数字人领域首部白皮书《虚拟数字人发展白皮书》,拥有10余项发明专利。
李江伟
华为河图
报告题目:华为河图(Cyberverse)- 开启数字新世界
讲者简介:李江伟,博士毕业于中科院自动化所。现担任华为河图首席科学家、河图技术开发部部长,全面负责河图空间计算,场景理解,虚实融合和仿真平台等关键算法引擎开发和产品落地,支撑河图平台业界领先。曾主导华为手机Camera算法架构设计,其关键特性成为华为旗舰机TOP卖点。
论坛日程
8月21日上午