利用Python进行简单的图像识别(验证码)

这是一个最简单的图像识别,将图片加载后直接利用Python的一个识别引擎进行识别

将图片中的数字通过 pytesseract.image_to_string(image)识别后将结果存入到本地的txt文件中

 1 #-*-encoding:utf-8-*-
 2 import pytesseract
 3 from PIL import Image
 4
 5 class GetImageDate(object):
 6     def m(self):
 7         image = Image.open(u"C:\\a.png")
 8         text = pytesseract.image_to_string(image)
 9         return text
10
11     def SaveResultToDocument(self):
12         text = self.m()
13         f = open(u"C:\\Verification.txt","w")
14         print text
15         f.write(str(text))
16         f.close()
17
18 g = GetImageDate()
19 g.SaveResultToDocument()

具体想要实现上面的代码需要安装两个包和一个引擎

在安装之前需要先安装好Python,pip并配置好环境变量

所有包的安装都是通过pip来安装的,需要在windows PowerShell中进行,并且是在 C:\Python27\Scripts目录下

1.第一个包: pytesseract

pip install pytesseract

若是出现安装错误的情况,安装不了的时候,可以将命令改为 pip.exe install pytesseract来安装

若是将pip修改为pip.exe安装成功后,那么下文的所有pip都需要改为pip.exe

2.第二个包:PIL安装

pip install PIL

若是失败了可以如下修改 pip install PILLOW

3.安装识别引擎tesseract-ocr

下载 tesseract-ocr,进行默认安装

安装完成后需要配置环境变量,在系统变量path后增加 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR;

一切都安装完成后运行上述代码,会发现报错,此时需要

至此结束

时间: 2024-10-12 23:53:55

利用Python进行简单的图像识别(验证码)的相关文章

利用python,简单的词语纠错

利用python,编写一个简单的词语纠正修改器. 原文:http://norvig.com/spell-correct.html #!/usr/bin/env python # coding=utf-8 import re,collections import string ''' How to Write a Spelling Corrector http://norvig.com/spell-correct.html ''' def words(text): return re.findal

利用Python进行简单的数据处理

目录 绘制简单的折线图 绘制简单的散点图 绘制随机漫步图 使用 Pygal 来模拟抛骰子 使用 Python 处理以 CSV 个数存储的数据 处理 JSON 文件存储的数据 使用 WebAPI 什么是 matplotlib ? matplotlib 是一个数学绘图库, 我们可以用它来制作一些简单的图表,例如折线图,或散点图. 绘制简单的折线图 import matplotlib.pyplot as plt squares = [1, 4, 9, 16, 25] plt.plot(squares)

如何利用python+Selenium对登录的验证码进行验证?

python+Selenium自动识别验证码Fg.save_screenshot('D:\HuaYu\image\image.png')ce = Fg.find_element_by_id("ensure") # 具体的id要用F12自行查看print(ce.location)im = Image.open('D:\HuaYu\image\image.png') 根据图片调整位置img = im.crop((860,507,945,532))print(img)img.save('D:

看我如何利用Python写简单网络爬虫

平时没事喜欢看看freebuf的文章,今天在看文章的时候,无线网总是时断时续,于是自己心血来潮就动手写了这个网络爬虫,将页面保存下来方便查看 先分析网站内容,红色部分即是网站文章内容div,可以看到,每一页有15篇文章 随便打开一个div来看,可以看到,蓝色部分除了一个文章标题以外没有什么有用的信息,而注意红色部分我勾画出的地方,可以知道,它是指向文章的地址的超链接,那么爬虫只要捕捉到这个地址就可以了. 接下来在一个问题就是翻页问题,可以看到,这和大多数网站不同,底部没有页数标签,而是查看更多,

利用Python编写简单的Web静态服务器(TCP协议)

import socket def service_client(new_socket): #接受客户端的需求 request = new_socket.recv(1024) print(request) #回传数据给客户端 response = 'HTTP/1.1 200 OK\r\n' response += '\r\n' response += '<h1>你好</h1>' new_socket.send(response.encode('utf-8')) def main()

Python实现简单的四则运算

GitHub 项目地址 https://github.com/745421831/-/tree/master PSP PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟) Planning 计划 10 20 · Estimate · 估计这个任务需要多少时间 10 10 Development 开发 360 600 · Analysis · 需求分析 (包括学习新技术) 30 40 · Design Spec · 生成设计文档 30

python 中简单的输出语句

1 python 中简单的输出语句 #coding:utf-8#输出的是整数,得到的也是整数,用raw_inputusername=raw_input('请输入用户名:')#输出的是整数或者字符串,得到的只是字符串#在终端输入时:python空格.py文件拖入pwd=raw_input('请输入密码:')#两个条件同时成立才执行if username=='lily'and pwd=='abc':print 'login'else:print 'notlogin' 2 利用python定义简单的函

python 简单图像识别--验证码

python  简单图像识别--验证码 记录下,准备工作安装过程很是麻烦. 首先库:pytesseract,image,tesseract,PIL windows安装PIL,直接exe进行安装更方便(https://files.cnblogs.com/files/Oran9e/PILwin64.zip)(https://files.cnblogs.com/files/Oran9e/PILwin32.zip) 安装 image:pip install image 安装 pytesseract:pi

python 简单图像识别--验证码Ⅲ

python  简单图像识别--验证码Ⅲ 实现自动登陆网站 登录学校图书馆管理系统为例,做一个简单的例子.python识别简单的没有干扰的纯数字验证码还是可以的,但是识别字母数字再加上干扰因素,误报率很高,因此这个我是采用"人工识别",人工输入. 首先得明白cookie的作用,cookie是某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据.因此我们需要用Cookielib模块来保持网站的cookie. 登录学校图书馆管理系统登陆(http://122.207