图像识别OCR,广泛用于识别各种证件、卡类、甚至发票和单据,快速把图片信息转换成文本信息;主要用于解决快速卡证类的信息输入,以及卡证的接口调用查询;
目前支持API的方式调用,图片支持Base64编码以及图片Url两种方式,目前支持的格式有:jpg、png、bmp三种格式,建议文件大小在2M以内。
一.技术实现流程:
二. 图像矫正技术:
之前对于OCR文字识别的图像要求非常高,不仅需要分辨率高,而且还需要比较正,歪斜或者对焦不准照成的模糊和光影都会对识别的准确率造成非常大的影响。我们通过对拍摄图片的智能检测自动拉伸、矫正、增强对比,只为提高OCR的识别率。
原图
矫正
增强对比识别
三.基于AI深度学习的版面分析技术
我们通过数百万的照片识别学习,智能纠错识别在各种干扰环境中的准确识别,大大提高OCR识别的准确率。
四. 基于各种证件的特定汉字形态优化算法:
各种证件五花八门,字体大小形态也是各异,我们针对每一类证件进行特定优化识别,精确化的文字的字体、版面布局、文字比例大小等,进一步提高OCR识别的精度与准度。
五.全角度识别无压力
正着拍,倒着拍,翻着拍,想怎么拍就怎么拍,我们都能准确无误的识别。
输出示例:
原文地址:http://blog.51cto.com/13567544/2147179
时间: 2024-10-27 01:51:48