Python|基于百度API五行代码实现OCR文字高识别率


朋友扔过来一张图片,说在整理试题答案,但是试题是图片,想从网上搜索答案一个一个敲太累了,能不能将图片里的文字提取出来?
我一看这是典型的OCR识别啊,直接祭出神器Tesseract.

tesseract -l chi_sim 4.png stdout
目

二 画 口 “ 口 出

再对比原图一看

哦,不,是不是差的有点儿多?
怎么办呢?tesseract识别不利,肯定是咱玩的不溜,为了识别几张图,再进行一通识别训练是不是有点儿浪费时间?现在都2020年了,各大厂商都提供这种文字识别服务,像我知道的百度都号称50000次/天免费,就它了,开干
第一步 登陆 https://login.bce.baidu.com/

需要百度帐号,是偷是抢,各凭本事吧.
第二步 找到文字识别服务

乖乖,这大厂,就是不一样,产品真多.
第三步 创建一个应用


立即创建
第四步 拿到AppID,API Key,Secret Key

下面是见证五行代码的时刻了
第一步 安装百度Python SDK

pip install baidu-aip

第二步 替换之前拿到 AppID,API Key,Secret Key并修改图片地址

from aip import AipOcr

APP_ID = ‘xxx‘
API_KEY = ‘xxx‘
SECRET_KEY = ‘xxx‘
IMAGE_URL=‘~/4.png‘
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
with open(IMAGE_URL, ‘rb‘) as fp:
    res         = client.basicGeneral(fp.read())
    for words_arr in res.get(‘words_result‘):
        print(words_arr[‘words‘].replace(‘.口‘,‘.‘).replace(‘.回‘,‘.‘))

第三步 run

$ python ocr-baidu.py 

4、知觉的特性包括()
A.整体性
B.选择性
C.恒常性
D.间接性
E.理解性
5、注意的功能有()
A.调节功能
B.维持功能
C.抑制功能
D.选择功能
E.启动功能


嗯 对比图片,比较完美, 收工!
that‘s all

原文地址:https://blog.51cto.com/rainbird/2483740

时间: 2024-08-29 22:16:51

Python|基于百度API五行代码实现OCR文字高识别率的相关文章

利用Python实现百度API的调用

1.先要注册百度API成为开发者, 下面是开发者申请链接: http://api.fanyi.baidu.com/api/trans/product/index 为方便使用,百度翻译开放平台提供了详细的接入文档,链接如下: http://api.fanyi.baidu.com/api/trans/product/apidoc 在翻译文档中列出了详细的使用方法,以下是接入文档原文: 例:将apple从英文翻译成中文: 请求参数: q=apple from=en to=zh appid=201506

百度地图热力图--批量地址转换应用(基于百度api)

需求:把外卖订餐地址做个用户分布热力图 思路分析:第一步去百度地图api开放平台找例子 http://lbsyun.baidu.com/jsdemo.htm#c1_15 首先从百度API的demo例子参考静态页面,其中数据格式是 然后我们就想把数据库里的地址批量转换但是百度API没有提供批量转换的接口.但是我们找到了百度webapi单个地址转换的接口 利用这个接口,在后台读取地址和统计个数,返回一个json 用HttpWebRequest去发起get请求返回json,在把返回的json转成对象

python调用百度api应用--小小翻译器

urllib库的使用 urllib库是python标准库中最常用的PYthon网页访问的模块,它可以让用户像访问本地文本文件一样读取网页的内容. urlib.request模块:用来打开和读取url urlib.error模块:包含一些由urlib.request产生的错误,可用try进行捕捉 urlib.parse模块:包含一些解析url的方法 urlib.robotparser模块:用来解析robots.txt文本文件 案例小小翻译器: 设计思路: 1.使用百度翻译向http://api.f

基于百度API的动态添加多点位置显示

作为一名初学者,又是自学,一个个对于别人很简单的问题,对自己而言却像一座难以逾越的大山 但问题被自己解决后,那种喜悦是难以言说的 最近在做一个关于多点位置显示,之前做过一个单点定位显示的小案例,就想也套用那个,但做了很多尝试,发现都不行 后来查阅好多资料,又结合百度地图DEMO,终于按照自己的理解弄出来了,在这里和大家分享一下,高手不要嘲笑 <script type="text/javascript"> // 百度地图API功能 var map = new BMap.Map

python调用百度API

from urllib.request import urlopen import requests import json url = "http://apis.baidu.com/txapi/mvtp/meinv" #API req = requests.get(url) headers= {'apikey':'自己的apikey'} #自己的apikey params = {'num':'5'} #请求参数(urlParam) : r = requests.get(url,par

基于百度语音识别API的Python语音识别小程序

一.功能概述 实现语音为文字,可以扩展到多种场景进行工作,这里只实现其基本的语言接收及转换功能. 在语言录入时,根据语言内容的多少与停顿时间,自动截取音频进行转换. 工作示例: 二.软件环境 操作系统:win10 语言:Python 版本:3.6.0 Python库:AipSpeech(百度语音识别SDK客户端),wave,PyAudio,paInt16 Python库安装:除百度为:pip install baidu-aip,其他直接 pip install *(库名) 即可. 三.原理概述

ocr文字识别软件ABBYY FineReader介绍

ABBYY是世界文档识别.数据捕获和语言软件技术开发商的领航者.其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可编辑可管理的电子文档形式,可以大大节省您的时间和精力. 理想的 OCR (Optical Character Recognition) .PDF 转换应用软件,不但提供高识别率,而且可以精确地保留原始设置和版面布局,可以把静态纸文件和 PDF 文件转换成可管理的电子格式!它可以将通过扫描仪.MFP 或数码相机生成的图像.PDF 文件,进行快速转换为

ocr文字识别软件安卓

图片转文字软件在现在已经非常常见了,很多人都把其当做办公必备软件,这样的软件能够快速将图片转换成文字,方便工作的开展.但是软件的识别效果一直是用户关心的问题,一些软件识别效果不好,会有大量的乱码和空白,这样最后的核对工作就要花费一定的时间.如果有一个软件有高识别率的话,将会节省更多的时间.所以没有找到捷速图片文字识别软件的人们一直在寻找.ocr识别软件 当然如果你已经拥有捷速图片文字识别软件的话就安心使用就可以,该软件是现在同类软件中识别效果最好的软件,高达98%左右,如果原稿质量好的情况下,还

中国领跑全球OCR文字识别:福昕扫描王广受欢迎

11月20日,有OCR领域奥斯卡之称的国际文档分析与识别大会(ICDAR)数据集最新结果公布,中国高校及企业包揽排行榜前五.截至目前,全球顶级的高校.科研机构及企业都参加过这项测试,包括Google.Microsoft.Amazon.Faceboo等国际知名企业,其含金量不言而喻. 福昕扫描王 出自中国企业之手的OCR文字识别应用,使用国内先进的OCR文字识别框架,能够识别办公场景与自然场景下的文字识别,并且支持全球主流的16种语言文字,识别率高. 从界面上看非常简洁,无广告,最关键的是OCR文