pytesseract在识别只有一个数字的图片时识别不出来

大家好，近期在做自动化测试时，遇到了一个问题需要通过识别图片来实现，遂用到了pytesseract模块和tesseract-ocr这个工具。在使用过程中发现，识别带有数字的图片时，如果这个图片上仅有一个数字，则识别不出来，如下图。若识别2个数字以上的图片则可以识别出来，如下图。（2个数字有时可以识别，有时不行。）两种图片的运行结果如下图。这个问题出现的时候就一脸懵逼了，就怕这种“偶现”的问题，因为我是第一次用tesseract-ocr，在网上找了一下午也没有找到结果，最后加了一个tesseract-ocr的QQ群，群里大神建议我加-psm参数试试，然后就去了解了一下这个参数的用法，最后加了-psm 6这个参数后，果然可以识别，具体代码及运行结果如下图

原文地址：https://www.cnblogs.com/zy0209/p/10162917.html

时间： 2024-10-08 11:14:19

pytesseract在识别只有一个数字的图片时识别不出来的相关文章

【Python】使用Face++的人脸识别detect API进行本地图片情绪识别并存入excel

准备工作首先,需要在Face++的主页注册一个账号,在控制台去获取API Key和API Secret. 然后在本地文件夹准备好要进行情绪识别的图片/相片. 代码介绍下所使用的第三方库 --urllib2是使用各种协议完成打开url的一个库 --time是对时间进行处理的一个库,以下代码中其实就使用了sleep()和localtime()两个函数,sleep()是用来让程序暂停几秒的,localtime()是格式化时间戳为本地的时间 --xlwt是对excel进行写入操作的一个库 --os是

第二十三节：scrapy爬虫识别验证码（二）图片验证码识别

图片验证码基本上是有数字和字母或者数字或者字母组成的字符串,然后通过一些干扰线的绘制而形成图片验证码. 例如:知网的注册就有图片验证码首先我们需要获取验证码图片,通过开发者工具我们可以得到验证码url链接其次就是通过Pillow类库和tesserocr进行识别,代码如下: 1 # -*- coding:utf-8 -*- 2 import tesserocr 3 from PIL import Image 4 import requests 5 6 # 通过url链接获取验证码图片,并写入本

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果

1,下载安装Tesseract-OCR 安装,链接地址https://digi.bib.uni-mannheim.de/tesseract/ ? 2,安装成功 tesseract -v 注意:安装后,要添加系统环境变量 ? 3,cmd指定目录到 cd C:\Work\BlogsTest\TestPic,要识别图片的文件夹识别:tesseract test.png result -l chi_sim ? 识别成功的效果,result.txt文件会自动生成 ? 要注意:Tesseract-OCR的

字符型图片验证码识别完整过程及Python实现

1 摘要验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的防火墙功能,但是随时OCR技术的发展,验证码暴露出来的安全问题也越来越严峻.本文介绍了一套字符验证码识别的完整流程,对于验证码安全和OCR识别技术都有一定的借鉴意义. 2 关键词关键词:安全,字符图片,验证码识别,OCR,Python,SVM,PIL 3 免责声明本文研究所用素材来自于某旧Web框架的网站完全对外公开的公共图片资源. 本文只做了该网站对外公开的公共图片资源进行了爬取, 并未越权

用图片文字识别软件复制微信小助手的开票信息

微信目前有开票小助手的功能,可以保存开票信息,客户经常会发微信开票小助手里的截图,附带有个二维码,这边可以扫描二维码获取抬头,虽然听说有用二维码极速开票的,对于这个不清楚,也不打算了解,本人还是用的传统方式,开票信息也不算多,最多也就四条.刚开始的时候,如果客户发这种图,我会直接对照着手打,因为数据不是很多,如果不是很忙,没有其他事情,下单的时候还没给快递打电话,手打之后在一个个对照一下,确认后打出来,再对照一下,也没什么问题.后来,客户由于有时候下午下单,时间有时候比较晚,已经给顺丰打电话了,

《神经网络和深度学习》系列文章一：使用神经网络识别手写数字

出处: Michael Nielsen的<Neural Network and Deep Leraning> 本节译者:哈工大SCIR硕士生徐梓翔 (https://github.com/endyul) 声明:我们将不定期连载该书的中文翻译,如需转载请联系[email protected],未经授权不得转载. “本文转载自[哈工大SCIR]微信公众号,转载已征得同意.” 使用神经网络识别手写数字感知机 sigmoid神经元神经网络的结构用简单的网络结构解决手写数字识别通过梯度下降法学

职场专业图片文字识别的方法，你知道吗

在职场中又一个专业的图片文字识别方法,工作不是经常整理图片文字的员工不知道,那就是使用一下专业的OCR文字识别软件,在加上专业的操作方法,就可以快速的把图片上的文字识别出来了.在平时生活中实现图片文字识别的方法不是很好用,而且操作步骤很繁琐,下面小编就分享一个专业的图片文字识别方法.工具和原料:1:带有文字的图片:2:OCR文字识别工具.操作方法:第一步:[打开OCR软件]:在电脑上打开文字识别软件,大家可以通过浏览器搜索关键词"迅捷OCR文字识别软件"找到OCR软件.第二步:[极速识

使用电脑实现图片文字识别的方法

电脑是我们常用的办公工具之一,在职场中,唯独不可缺少的就是电脑,整理一些文件和处理一些工作,我们都需要在电脑上进行,那么我们如何在电脑上实现图片文字识别呢,知道方法的人很简单,只需要在电脑上准备一个工具,便可以轻松的完成,下面小编分享一个简单而又高效的方法.使用工具:迅捷OCR文字识别工具:操作方法:第一步:在电脑上运行OCR文字识别软件,不知道在哪下的朋友,可以打开百度或者是软件管家上面下载: 第二步:点击左边功能栏中的极速识别功能,进入图片文字识别界面:第三步:点击上面的添加文件按钮,将需要

一文全解：利用谷歌深度学习框架Tensorflow识别手写数字图片（初学者篇）

笔记整理者:王小草笔记整理时间2017年2月24日原文地址 http://blog.csdn.net/sinat_33761963/article/details/56837466?fps=1&locationNum=5 Tensorflow官方英文文档地址:https://www.tensorflow.org/get_started/mnist/beginners 本文整理时官方文档最近更新时间:2017年2月15日 1.案例背景本文是跟着Tensorflow官方文档的第二篇教程–识别手

猜你喜欢

线性基小节

1.线性基的异或集合中每个元素的异或方案唯一. 2.线性基二进制最高位互不相同. 3.线性基中元素互相异或,异或集合不变. 摘自百度文库线性基能相互异或得到原集合的所有相互异或得到的值. 线性基是满 ...

dijkstra 两点的最短路径单源最短路径

思路以dist数组来扩充路径的访问,不断的刷新dist数组设置一个顶点的集合s,并不断地扩充这个集合,一个顶点属于集合s当且仅当从源点到该点的路径已求出.开始时s中仅有源点,并且调整非s中点的 ...

OAF 动态创建组件以及动态绑定属性

在开发中,我们遇到以下一个需求. 一个表格左侧有5列是固定存在的,右侧有N列是动态生成的,并且该N列中第一列可输入,第二列是不可编辑的,但是是数字,如果小于0,那么就要显示为红色,重点标识出来. 首先 ...

Shell排序和二叉树排序

Shell排序 #include<iostream> using namespace std; void Print(int *list, int len); void ShellSort ...

HTML5 02. 多媒体控件、拖拽事件、历史记录、web存储、应用程序缓存、地理定位、网络状态

多媒体 video:是行内块(text-align: center; 对行内块适用) <figure></figure>: 多媒体标签 : <figcaption> ...

java的awt和swing的区别于联系

AWT 是Abstract Window ToolKit (抽象窗口工具包)的缩写,这个工具包提供了一套与本地图形界面进行交互的接口.AWT 中的图形函数与操作系统所提供的图形函数之间有着一一对应的关 ...

Yii学习笔记之三（在windows 上安装 advanced ）

首先说一下下载地址: http://www.yiiframework.com/download/ 然后将下载下来的文件进行解压到你指定的目录解压过程中如果报什么错误直接忽略掉我的解压目录是:E ...

AxStream.v3.2.1.4.Win64 1CD流体机械设计

AxStream.v3.2.1.4.Win64 1CD流体机械设计AxSTREAM套装软件是美国SoftInWay公司设计.销售的,具备设计涡轮机.压缩机功能,计算现有涡轮机器的设计工况与非设计工况操 ...

部署CA

推荐安装"证书颁发机构"和"证书颁发机构Web注册".后者主要用于域外的客户端注册安装IIS时在安全性模块内打钩"基本身份验证"其余安装步 ...

对于小的并发量，我们能做的一些简单的优化，特别实际

其实很多时候,我们在现实生活中遇到的很多并发量并没有像淘宝双十一一样,可能只有它的1%而已,不要总想着,要么你的项目并发量特别大,要么你的项目并发量基本没有. 其实在实际中,我们应该尽可能的去优化我们 ...

于CentOS 6.5编译器安装Git 1.8

yum install git版本号是太老,它是1.7.1. 在这里,我们将介绍如何编译和安装Git 1.8 yum install curl-devel expat-devel gettext-de ...

泛函编程（26）－泛函数据类型－Monad－Applicative Functor Traversal

前面我们讨论了Applicative.Applicative 就是某种Functor,因为我们可以用map2来实现map,所以Applicative可以map,就是Functor,叫做Applicat ...

软件工程之建议

时光荏苒,一学期的时间很快就过去了,这是我第一次接触到软件工程的概念,这也是第一次让我知道了,软件并不是简简单单的开发,而是要经过一个漫长的过程,分析,设计,编码,测试等等,这也是为什么我们专业名字叫 ...

企业内网IE浏览器兼容性支持和加速方法

修改IE浏览器配置加速IE浏览器: 取消"对证书地址不匹配发出警告"勾选取消"检查服务器证书是否已吊销*"勾选取消"检查提交的POST重定向到不允许发 ...

【拓扑排序】【堆】CH Round #57 - Story of the OI Class 查错

拓扑排序,要让字典序最小,所以把栈改成堆. 1 #include<cstdio> 2 #include<queue> 3 #include<algorithm> 4 ...

Poj 3279 Fliptile 【枚举】

Fliptile Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 4161 Accepted: 1585 Description ...

在.Net MVC中自定义ValidationAttribute标签对Model中的属性做验证

写一个继承与ValidationAttribute类的自定义的验证方法 MVC中传递数据时,大多数都会用Model承载数据,并且在传到控制器后,对Model进行一系列的验证. 我平时经常使用的判断方法 ...

使用liunx系统自带的工具sar监控指定接口速率

1.路由器双出口部署,接口可以实现负载分担,在接口负载比例设置为1:2之后,管理员反馈流量有些异常,内网tracert -d 外网域名或者IP,都走一条链路. 2.底层尝试使用sar命令监控两个接口的 ...

java学习笔记-尚硅谷0918班刘蕾*：既然选择了远方，便只顾风雨兼程

从开学以来,一直都过着忙碌的生活,生活很规律,也很辛苦.第一次来到北京java培训这么久,自己一个人离开家这么久,才开始觉得很新鲜,特别享受一个人的感觉,但是时间久了,就想回家,怀念在家被爸妈宠爱的感 ...

SpringMVC学习系列之表单标签

http://www.cnblogs.com/liukemng/p/3754211.html 本篇我们来学习Spring MVC表单标签的使用,借助于Spring MVC提供的表单标签可以让我们在视图 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.026 s.