王磊:AI 时代物流行业的 OCR 应用

欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~

OCR 是人工智能里面非常重要的基础能力之一。腾讯云人工智能产品总监王磊,结合物流场景解读了OCR技术。“OCR文本识别能够优化物流行业流程,解放人力降低成本。”

腾讯云人工智能产品总监王磊

王磊介绍,OCR文本识别存在三大挑战。其一是文本是由多个文字拼接组成,没有明显边界,文本框内除了笔画,其余部分均是背景,给文本识别特征提取带来难度;其二是文本是由若干汉字、英文或标点符号混合在一起,长度变化大,由于网络感知野受限,定位BOXES本身困难;其三是如果BOXES贴合精度不够,会直接导致后续的文字识别错误。腾讯优图实验室为OCR识别搭建了四层处理系统,并配备三大引擎。一是运单的版式识别引擎,可以对运单的版式进行分类;二是运单的字段定位引擎;三是运单的字段识别引擎。

为了解决这些问题,腾讯优图实验室在文本检测技术方进行了深度优化,提出了Compact Inception,通过设计合理的网络结构来提升各尺度的文字检测/提取能力。同时引入RNN多层自适应网络和Refinement结构来提升检测完整性和准确性。

在文本识别方面,经过大量实验和实践,腾讯优图实验室对主流CNN+RNN+CTC方法进行了改进和创新:对CNN加入了横向非对称卷积和综合多种尺度感受野的特征,增强了网络对多尺度字体的支持。对RNN加入了Attention机制。Attention机制的加入,可以在所有特征块的基础上,得到每一个特征块在全局中的权重信息。简单的理解,当决定当前字是几个形似字中的哪一个时,该字所处的上下文位置和语义相关性是更具有决定意义的,甚至会比图像信息本身更重要。可以有效提升整行识别的准确率。性能上则通过网络轻量化设计和裁剪、矩阵计算优化、通道优化、GPU/CPU的定向优化等技术,保证了实际应用落地。现在腾讯云OCR能够做到7×24小时提供识别服务,每张运单5秒钟可以完成;识别准确率达到91%,并且整个识别流程不需要人工深度参与,极大的降低用户隐私泄露的风险。

相关推荐

腾讯云王琰:腾讯云AI Cloud的技术、应用布局和趋势

识别手写快递单、听懂人话的小微...腾讯云公布了哪些大动作?

欢迎关注腾讯云技术社区,更多技术干货等着你。



此文已由作者授权腾讯云技术社区发布,转载请注明文章出处

https://cloud.tencent.com/community/article/403476

时间: 2024-08-29 12:00:10

王磊:AI 时代物流行业的 OCR 应用的相关文章

腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍(3)

欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:周景超 在上一期中介绍了我们团队部分已公开的国际领先的研究成果,近期我们有些新的成果和大家进一步分享. 1 人脸进展 人脸是最重要的视觉信息之一.以貌识人.以貌取人是人的本性,也是最自然.最常用的身份确认和交互方式之一.互联网和移动互联网上每天上传和传播的天文数字级别的照片中有很大一部分都是和人脸相关的(比如国际知名互联网公司Facebook每天都有亿级以上的海量人脸照片和视频上传),因此人脸检测与识别技术在学术界和工业界都备受关注

AI时代下,你会成为下一个失业者吗?

据昆山市政府报告指出,将近600多家企业已经计划在未来引入机器工人.昆山共有4800家台湾企业,占其GDP的60%以上.如果自动化.智能化计划进展顺利,也许迫使超过200万人失业. 不仅仅在昆山,富士康深圳龙华厂区也正在进行着一场流水线上的革命,富士康近百台不同型号和不同工种的机器人已经在厂区内开发.调试和运作. 职业的消失,千万不要觉得这离我们很遥远.上个世纪,已经有打字员.铁匠.电话接线员等很多职业消失了.随着科技的快速发展,未来职业变迁的速度也将越来越快. AI时代下,你会成为下一个失业者

共享储物柜的出现提升物流行业投递效率

继滴滴之后,出现了一大批共享服务平台,共享单车.共享汽车.共享充电宝.共享经济,从理论上来说,是用户的使用权代替所有权,让物品本身的利用效益发挥最大,使用成本降低.快递柜应趋势而生,作为用户取件.快递员投件的智能终端设备,节省取件人的时间,更成倍提升物流行业投递效率. 共享储物柜,通过微信/app查寻最近储物柜,实行快速对物品的存取.它能有效地减轻了游玩.逛街时双肩双手的负担,而且通过客户端操作存取物品,完全剔除了之前传统寄存柜触摸显示器.IC卡维护等大量硬件支持人员和维护人员的成本,但最重要的

AI时代的游戏革命:华为云的进击方案

玩游戏这件事,今天已经成为了我们生活中的日常.但假如我们回想一下十几年时间里游戏经历的变化,相信大家都会认同"翻天覆地"这个词绝不为过. 十几年前,笔者玩的还是小霸王和超级玛丽,到了今天PC和主机游戏的画面已经无限炸裂,手游成为随时随地可以发生的娱乐方式.电竞和游戏周边产业也几何级增长.在这些变化背后,隐藏着的其实是基础信息设施的不断进化.从PC.移动设备到云计算,每一次游戏的升级基本都与科技基础的升级保持同频. 那么到了人工智能时代,游戏当然也不会停步不前.但关于AI时代的游戏,我们

BAT的数据红利,催生AI时代的敏捷计算力

人工智能开放组织OpenAI 于2018年5月发布的分析表明,人工智能训练任务中使用的算力,自 2012 年以来呈指数级增长,目前速度为每 3.5 个月翻一倍,而相比之下的摩尔定律则是每 18 个月翻倍.自 2012 年以来,人们对于算力的需求增长了超过30万倍.在此期间,硬件算力的提升一直是人工智能快速发展的重要因素. 人工智能对于算力需求的飙升,很大程度上是互联网公司的数据红利造成的.9月12日,浪潮联合IDC正式对外公布<2018中国AI计算力发展报告>摘要版,报告对中国AI计算力发展作

下一个20年全球开发者将过亿?Tesra超算网络与开发者一起迎接AI时代的到来!

在2018年10月24日的全球开发者节上,?IT 技术社区 CSDN 创始人称下一个 20 年,全球开发者的数量将过亿. AI已经诞生六十年,经历了低谷,也经历了高潮.2016年AlphaGo 取得了重大突破,导致大众媒体对事态的关注增加,而对于人工智能的关注也到了最高峰,AI时代的大门已经打开. 很多人担心AI时代全面来临之后程序员会被取代,实际上这种担心是完全没有必要的.从PC互联网到移动互联网,程序员的增长是数百万级的,而在未来,所有的公司都将会是技术性公司,所有的公司都会数字化,只要数字

AI时代的大门已经打开,Tesra超算网络将加速这个进程!

很多人担心AI时代全面来临之后程序员会被取代,实际上这种担心是完全没有必要的.从PC互联网到移动互联网,程序员的增长是数百万级的,而在未来,所有的公司都将会是技术性公司,所有的公司都会数字化,只要数字化,它就会进入 AI,就会需要开发者,所以开发者会在每一个行业普及,AI也将改变各行各业. AI已经诞生六十年,经历了低谷,也经历了高潮.2016年AlphaGo 取得了重大突破,导致大众媒体对事态的关注增加,而对于人工智能的关注也到了最高峰,AI时代的大门已经打开. 在2018年10月24日的全球

好未来谢华亮:AI 在教育行业中的应用

11 月 23 日,在以「AI 产业技术的***与融合」为主题的 NIUDAY 北京站中,好未来 SEG 智慧教育事业部技术总监谢华亮为大家带来了关于「AI 在教育行业中的应用」的分享. 本文是对分享内容的实录整理. 大家好,特别感谢七牛云邀请我来做这个分享,我今天要给大家带来的是 AI 在整个教育领域的应用. 我今天的主题是新时代.新技术.新教育. 我们过去老师的模式是在黑板上讲,学生在下面听,现在时代已经不一样了.我们现在面临的时代,由于 AI .新技术的普及,对过去的教育方式是一种颠覆.我

AI时代做一个终身学习者

第六章  AI时代的教育和个人发展 1. 2013年,全美录取最严格的一所四年制大学本科学校--米涅瓦成立了,由美国著名教育家联合创立,校长是本·尼尔森,录取率低于哈佛的8-9%,是3%. 创始人相信,传统的大学教育已经无法适应未来的需要,会被改革甚至被颠覆.远程在线课程(难以深入交流).研讨小组.实习实践.自我探索.自我完善将成为今后教育的主流. 这些重在培养学生的逻辑分析.创造性思维.交流能力和复杂环境的协作能力. 这所大学按研究生.博士生的标准去培养大学生. 2. 学什么? AI时代很难准