创蓝万数平台图像识别OCR技术

图像识别OCR,广泛用于识别各种证件、卡类、甚至发票和单据,快速把图片信息转换成文本信息;主要用于解决快速卡证类的信息输入,以及卡证的接口调用查询;
目前支持API的方式调用,图片支持Base64编码以及图片Url两种方式,目前支持的格式有:jpg、png、bmp三种格式,建议文件大小在2M以内。

一.技术实现流程:

二. 图像矫正技术:

之前对于OCR文字识别的图像要求非常高,不仅需要分辨率高,而且还需要比较正,歪斜或者对焦不准照成的模糊和光影都会对识别的准确率造成非常大的影响。我们通过对拍摄图片的智能检测自动拉伸、矫正、增强对比,只为提高OCR的识别率。


原图

矫正

增强对比识别

三.基于AI深度学习的版面分析技术
我们通过数百万的照片识别学习,智能纠错识别在各种干扰环境中的准确识别,大大提高OCR识别的准确率。

四. 基于各种证件的特定汉字形态优化算法:
各种证件五花八门,字体大小形态也是各异,我们针对每一类证件进行特定优化识别,精确化的文字的字体、版面布局、文字比例大小等,进一步提高OCR识别的精度与准度。

五.全角度识别无压力

正着拍,倒着拍,翻着拍,想怎么拍就怎么拍,我们都能准确无误的识别。
输出示例:

原文地址:http://blog.51cto.com/13567544/2147179

时间: 2024-10-27 01:51:48

创蓝万数平台图像识别OCR技术的相关文章

创蓝万数平台接入指南

注册:未登录状态下,创蓝万数官网任意界面,右上角点击[免费注册] 或在万数官网任意界面,右上角点击[万数控制台]登录页面点击[注册新账号]进入注册资料填写页面,根据提示填写信息若已有云通讯账号,则无需注册,直接登录即可 登录:万数官网任意页面右上角点击[登录]登录成功后再点击右上角[万数控制台]进入后台或先点击[万数控制台]进入登录页面登录成功后将直接进入万数后台也可以把登录地址保存至收藏夹 认证:未认证状态下无法使用API产品,但可以使用在线检测产品请尽快完成企业认证认证地址:账户中心--账户

数平精准推荐 | OCR技术之系统篇

导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础.算法.数据.系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升级. 一.背景介绍 前面的系列文章分别介绍了算法和数据,如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础.算法.数据.系统三位一体,组合成完整的OCR在线服务.伴随着算法的升级和业务的持续接入,系统也经历了从单机版升级到分布式版本:从为了每个算

数平精准推荐 | OCR技术之数据篇

导语:深度学习在OCR领域的成功应用需要大量数据,数平精准推荐团队利用图像增强,语义理解,生成对抗网络等技术生成高质足量的数据,为算法模型提供燃料,帮助OCR技术服务在多种业务场景中快速迭代,提升效果. 一. 背景介绍 如果把深度学习看做引擎,大量带标注的数据则是燃料,燃料的体量和质量直接影响引擎的动力.随着计算能力大幅增强,深度学习模型已向着wide & deep的方向越走越远,更大更深的模型需要更多的数据训练.这一点从近年来学术界与工业界竞相公开的数据集规模上可见一斑.以经典的计算机视觉任务

【PHP】创蓝253云通信平台国际短信接口调用demo案例

PHP接口请求类<?phpheader("Content-type:text/html; charset=UTF-8"); / 类名:ChuanglanSmsApi 功能:创蓝接口请求类 详细:构造创蓝短信接口请求,获取远程HTTP数据 版本:1.3 日期:2017-04-12 说明: 以下代码只是为了方便客户测试而提供的样例代码,客户可以根据自己网站的需要,按照技术文档自行编写,并非一定要使用该代码. 该代码仅供学习和研究创蓝接口使用,只是提供一个参考.*/ class Chu

Python爬虫入门教程 56-100 python爬虫高级技术之验证码篇2-开放平台OCR技术

今日的验证码之旅 今天你要学习的验证码采用通过第三方AI平台开放的OCR接口实现,OCR文字识别技术目前已经比较成熟了,而且第三方比较多,今天采用的是百度的. 注册百度AI平台 官方网址:http://ai.baidu.com/ 接下来申请 接下来创建一个简单应用之后,就可以使用了,我们找到 阅读文字识别相关文档 你需要具备基本的阅读第三方文档的能力,打开我们需要的文档 https://cloud.baidu.com/doc/OCR/OCR-API.html#.E9.80.9A.E7.94.A8

创蓝253云通讯paas平台Python短信接口demo

#!/usr/local/bin/python#-- coding:utf-8 -- Author: jacky Time: 14-2-22 下午11:48 Desc: 短信http接口的python代码调用示例 import httplibimport urllib #服务地址host = "sms.253.com" #端口号port = 80 #版本号version = "v1.1" #查账户信息的URIbalance_get_uri = "/msg/

【ASP】创蓝253云通讯paas平台短信验证码接口调用demo

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%><%Function Post(url,data)dim Https set Https=server.createobject("MSXML2.XMLHTTP")Https.open "POST",url,falseHttps.setRequestHeader "Content-Type","ap

【PYTHON】创蓝253云通讯平台国际短信API接口DEMO

#!/usr/local/bin/python#-- coding:utf-8 -- Author: jacky Time: 14-2-22 下午11:48 Desc: 短信http接口的python代码调用示例 import httplibimport urllibimport json#服务地址 host = "intapi.253.com" #端口号port = 80 #版本号version = "v1.1" #查账户信息的URIbalance_get_uri

转:鏖战双十一-阿里直播平台面临的技术挑战(webSocket, 敏感词过滤等很不错)

转自:http://www.infoq.com/cn/articles/alibaba-broadcast-platform-technology-challenges 鏖战双十一-阿里直播平台面临的技术挑战 作者 陈康贤 发布于 2016年1月28日 | 2 讨论 分享到:微博微信FacebookTwitter有道云笔记邮件分享 稍后阅读 我的阅读清单 前言:一直以来双十一都是以交易为重心,今年当然也是如此,但是这并不妨碍万能的淘宝将双十一打造的让用户更欢乐.体验更丰富.玩法更多样.内容更有趣