OCR前沿技术与产业应用插图

| 学术论坛-OCR前沿技术与产业应用

基本信息

论坛形式:研讨会
论坛时长:2小时
承办专委会:CSIG文档图像分析与识别专委会、CAA模式识别与机器智能专委会

论坛介绍

文字是人类思想、知识和文化传承不可或缺的载体,也是人类信息交流和感知世界重要载体。利用计算机从文档图像中识别出文字的技术称为光学字符识别或文字识别,即OCR(Optical Character Recognition)。文字识别可以把海量非结构化数据转换为结构化数据,从而支撑各种创新的人工智能应用,是图像处理及人工智能领域的重要基础性技术之一。近年来,OCR领域的研究取得了巨大进展,并在许多真实场景的AI应用系统中发挥着重要的作用,包括文档数字化、信息录入、图像搜索、办公自动化、智慧金融、智慧教育、内容审查及信息安全、机器人导航等。为了促进OCR领域的技术交流及发展,探讨OCR相关的文档图像处理与分析、识别及理解相关技术在国民经济和社会生活的重要应用,特此组织此次论坛。本次论坛邀请了3位来自高校/科研院所的学术界专家、3位来自知名企业的杰出技术专家做特邀报告,共同交流OCR领域的前沿学术和技术进展、OCR在典型行业的规模化应用情况,并探讨OCR的未来技术及产业发展趋势。

论坛主席

OCR前沿技术与产业应用插图1

刘成林 
中科院自动化所

个人简介:刘成林,研究员,现任中国科学院自动化研究所副所长,中国科学院大学人工智能学院副院长。研究方向为模式识别、机器学习和文档图像分析。主要研究成果包括:在手写字符识别、分类器设计与学习、字符串识别、文档版面分析等方面提出一系列有效的方法;研制的文字识别算法在邮政分拣机、表格处理、文档数字化、网络信息检索等领域获得广泛应用。在国际期刊和国际会议上发表论文300余篇,合著文字识别方面的英文专著一本。2005年获得国际文档分析与识别会议IAPR/ICDAR Young Investigator Award(青年学者奖),2008年获得国家杰出青年科学基金。刘成林教授目前是中国自动化学会和人工智能学会会士,IAPR Fellow, IEEE Fellow。

OCR前沿技术与产业应用插图2

金连文
华南理工大学

个人简介:金连文,华南理工大学教授。1991年于中国科技大学获学士学位、1996年华南理工大学获博士学位,目前为兼任中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任等学术服务职务。主要研究领域为文字识别、深度学习、计算机视觉及应用等,在IEEE Transactions及重要国际国内学术期刊、ICDAR / ICFHR /  CVPR / AAAI / IJCAI / NeurIPS / ECCV 等重要国际会议上发表学术论文200余篇,其中SCI期刊论文80余篇。获省部级科技奖5次(含排名第1的广东省科技进步一等奖1次),指导学生参加国际学术竞赛荣获冠军20余次。

报告嘉宾

OCR前沿技术与产业应用插图3

白翔
华中科技大学

报告题目:从线形排列文字到复杂结构文字:手写公式识别的新思考

讲者简介:白翔,华中科技大学人工智能与自动化学院教授,国家防伪工程技术研究中心副主任。主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文60余篇。由于在场景文字检测与识别取得的突出成就,2019年获IAPR/ICDAR Young Investigator Award (青年学者奖)。现任期刊IEEE Trans. PAMI,Int. Journal of Document Analysis and Recognition, Pattern Recognition, Frontier of Computer Science, 中国科学-信息科学、自动化学报编委。曾担任CVPR、AAAI、IJCAI、ICPR等人工智能主流国际会议的领域主席/资深技术程序委员或竞赛主席10余次。2020年入选国际模式识别协会会士。

OCR前沿技术与产业应用插图4

殷飞
中国科学院自动化研究所

报告题目:复杂图文混合文档分析与识别

讲者简介:殷飞,中国科学院自动化研究所副研究员。2010 年博士毕业于中国科学院自动化研究所模式识别国家重点实验室,一直从事文档图像分析与手写文字识别方向的研究。在文档分析的主流期刊(IEEE TPAMI,IJCV,IEEE TIP,PR)和主流学术会议(CVPR,ICCV,IJCAI,ICDAR,ICFHR 等)发表论文 80 余篇。带领研究团队多次获得文档分析领域国际学术竞赛冠军。

OCR前沿技术与产业应用插图5

连宙辉
北京大学

报告题目:AI驱动的字体设计与自动生成

讲者简介:连宙辉,北京大学王选计算机研究所副教授,中国文字字体设计与研究中心副主任。研究领域为计算机图形学与人工智能,近十年主要从事面向文字的形状建模与图像合成技术研究。主持完成国家自然科学基金面上、国家语委重点等科研项目,在领域重要期刊(TOG, IJCV等)与会议(SIGGRAPH/SIGGRAPH Asia, CVPR, NeurIPS等)上发表论文70余篇,谷歌学术引用1900余次,授权国家发明专利近20项。担任CCF-A国际会议ICCV-21领域主席,获中国专利优秀奖(排名1)、中国人工智能学会吴文俊人工智能优秀青年奖、北京市科技新星计划等奖励/资助。中文字体制作生成方面的部分成果已通过技术转让在企业投入使用,相关软件/产品广泛应用于各大主流移动平台上。

OCR前沿技术与产业应用插图6

武亚强
联想研究院

报告题目:面向K12的教育文档识别技术与应用

讲者简介:武亚强,高级工程师,联想研究院研发高级总监,中国图象图形学学会文档图像分析与识别专委会常务委员,计算机学会多媒体专委会执行委员,教育发展战略学会教育大数据分会理事,目前负责联想乐学教育技术平台及方案的的产品研发及技术创新工作,专注于人工智能在教育领域的应用,拥有超过100多项海内外专利,在文档识别与分析领域带领团队获得过十多次海内外学术竞赛冠军,曾获吴文俊科技进步二等奖和北京市科技进步二等奖。

OCR前沿技术与产业应用插图7

丁凯
合合信息

报告题目:复杂场景文字识别产业化应用与实践

讲者简介:丁凯,博士, 高级工程师,合合信息科技股份有限公司研发总监、AIM事业部副总经理,CSIG机器视觉专业委员会委员、CSIG文档图像分析与识别专委会委员,上海科技大学企业导师,华南理工大学校外研究生兼职导师。研究方向为人工智能、模式识别、文档分析与理解、OCR、自然语言处理、知识图谱等。带领团队获得OCR领域多项国际竞赛冠军。近年来主导合合信息的移动端多语言文字识别、电子文档还原、多模态智能文档理解、知识图谱构建与挖掘等技术的研发,并广泛应用到各类产品中,为全球企业和亿万级个人用户提供服务。

OCR前沿技术与产业应用插图8

胡益清
腾讯优图实验室

报告题目:基于多模态预训练的文档理解及实践

讲者简介:胡益清,男,腾讯优图实验室高级研究员。2017年于中国科学技术大学获得工学博士学位(中科大-伊利诺伊理工联合培养)。曾任讯飞AI研究院高级研究员,现任腾讯优图实验室高级研究员,第十一届合肥市青联委员,第四届安徽省青年科技工作者协会会员。目前的主要研究方向为光学字符识别和多模态文档理解,在UBICOMP,ACM Multimedia,AAAI等期刊/会议上发表学术论文十余篇(其中CCF A类五篇),累计申请专利二十余项。 在司内的重点工作为结合计算机视觉与自然语言理解能力,为内外部产品和业务线提供教育,财务及通用文档理解等解决方案。

论坛日程

8月21日上午

OCR前沿技术与产业应用插图9