pytesseract在识别只有一个数字的图片时识别不出来

大家好,近期在做自动化测试时,遇到了一个问题需要通过识别图片来实现,遂用到了pytesseract模块和tesseract-ocr这个工具。在使用过程中发现,识别带有数字的图片时,如果这个图片上仅有一个数字,则识别不出来,如下图。若识别2个数字以上的图片则可以识别出来,如下图。(2个数字有时可以识别,有时不行。)两种图片的运行结果如下图。这个问题出现的时候就一脸懵逼了,就怕这种“偶现”的问题,因为我是第一次用tesseract-ocr,在网上找了一下午也没有找到结果,最后加了一个tesseract-ocr的QQ群,群里大神建议我加-psm参数试试,然后就去了解了一下这个参数的用法,最后加了-psm 6这个参数后,果然可以识别,具体代码及运行结果如下图

原文地址:https://www.cnblogs.com/zy0209/p/10162917.html

时间: 2024-10-08 11:14:19

pytesseract在识别只有一个数字的图片时识别不出来的相关文章

【Python】使用Face++的人脸识别detect API进行本地图片情绪识别并存入excel

准备工作 首先,需要在Face++的主页注册一个账号,在控制台去获取API Key和API Secret. 然后在本地文件夹准备好要进行情绪识别的图片/相片. 代码 介绍下所使用的第三方库 --urllib2是使用各种协议完成打开url的一个库 --time是对时间进行处理的一个库,以下代码中其实就使用了sleep()和localtime()两个函数,sleep()是用来让程序暂停几秒的,localtime()是格式化时间戳为本地的时间 --xlwt是对excel进行写入操作的一个库 --os是

第二十三节:scrapy爬虫识别验证码(二)图片验证码识别

图片验证码基本上是有数字和字母或者数字或者字母组成的字符串,然后通过一些干扰线的绘制而形成图片验证码. 例如:知网的注册就有图片验证码 首先我们需要获取验证码图片,通过开发者工具我们可以得到验证码url链接 其次就是通过Pillow类库和tesserocr进行识别,代码如下: 1 # -*- coding:utf-8 -*- 2 import tesserocr 3 from PIL import Image 4 import requests 5 6 # 通过url链接获取验证码图片,并写入本

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果

1,下载安装Tesseract-OCR 安装,链接地址https://digi.bib.uni-mannheim.de/tesseract/ ? 2,安装成功 tesseract -v 注意:安装后,要添加系统环境变量 ? 3,cmd指定目录到 cd C:\Work\BlogsTest\TestPic,要识别图片的文件夹 识别:tesseract test.png result -l chi_sim ? 识别成功的效果,result.txt文件会自动生成 ? 要注意:Tesseract-OCR的

字符型图片验证码识别完整过程及Python实现

1   摘要 验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的 防火墙 功能,但是随时OCR技术的发展,验证码暴露出来的安全问题也越来越严峻.本文介绍了一套字符验证码识别的完整流程,对于验证码安全和OCR识别技术都有一定的借鉴意义. 2   关键词 关键词:安全,字符图片,验证码识别,OCR,Python,SVM,PIL 3   免责声明 本文研究所用素材来自于某旧Web框架的网站 完全对外公开 的公共图片资源. 本文只做了该网站对外公开的公共图片资源进行了爬取, 并未越权 

用图片文字识别软件 复制微信小助手的开票信息

微信目前有开票小助手的功能,可以保存开票信息,客户经常会发微信开票小助手里的截图,附带有个二维码,这边可以扫描二维码获取抬头,虽然听说有用二维码极速开票的,对于这个不清楚,也不打算了解,本人还是用的传统方式,开票信息也不算多,最多也就四条.刚开始的时候,如果客户发这种图,我会直接对照着手打,因为数据不是很多,如果不是很忙,没有其他事情,下单的时候还没给快递打电话,手打之后在一个个对照一下,确认后打出来,再对照一下,也没什么问题.后来,客户由于有时候下午下单,时间有时候比较晚,已经给顺丰打电话了,

《神经网络和深度学习》系列文章一:使用神经网络识别手写数字

出处: Michael Nielsen的<Neural Network and Deep Leraning> 本节译者:哈工大SCIR硕士生 徐梓翔 (https://github.com/endyul) 声明:我们将不定期连载该书的中文翻译,如需转载请联系[email protected],未经授权不得转载. “本文转载自[哈工大SCIR]微信公众号,转载已征得同意.” 使用神经网络识别手写数字 感知机 sigmoid神经元 神经网络的结构 用简单的网络结构解决手写数字识别 通过梯度下降法学

职场专业图片文字识别的方法,你知道吗

在职场中又一个专业的图片文字识别方法,工作不是经常整理图片文字的员工不知道,那就是使用一下专业的OCR文字识别软件,在加上专业的操作方法,就可以快速的把图片上的文字识别出来了.在平时生活中实现图片文字识别的方法不是很好用,而且操作步骤很繁琐,下面小编就分享一个专业的图片文字识别方法.工具和原料:1:带有文字的图片:2:OCR文字识别工具.操作方法:第一步:[打开OCR软件]:在电脑上打开文字识别软件,大家可以通过浏览器搜索关键词"迅捷OCR文字识别软件"找到OCR软件.第二步:[极速识

使用电脑实现图片文字识别的方法

电脑是我们常用的办公工具之一,在职场中,唯独不可缺少的就是电脑,整理一些文件和处理一些工作,我们都需要在电脑上进行,那么我们如何在电脑上实现图片文字识别呢,知道方法的人很简单,只需要在电脑上准备一个工具,便可以轻松的完成,下面小编分享一个简单而又高效的方法.使用工具:迅捷OCR文字识别工具:操作方法:第一步:在电脑上运行OCR文字识别软件,不知道在哪下的朋友,可以打开百度或者是软件管家上面下载: 第二步:点击左边功能栏中的极速识别功能,进入图片文字识别界面:第三步:点击上面的添加文件按钮,将需要

一文全解:利用谷歌深度学习框架Tensorflow识别手写数字图片(初学者篇)

笔记整理者:王小草 笔记整理时间2017年2月24日 原文地址 http://blog.csdn.net/sinat_33761963/article/details/56837466?fps=1&locationNum=5 Tensorflow官方英文文档地址:https://www.tensorflow.org/get_started/mnist/beginners 本文整理时官方文档最近更新时间:2017年2月15日 1.案例背景 本文是跟着Tensorflow官方文档的第二篇教程–识别手