[原]Python 使用pytesseract库识别验证码(MAC系统)

1.安装python

brew install python

2.安装PIL及图片格式支持

下载
http://www.pythonware.com/products/pil/index.htm

解压
tar -xzf Imaging-1.1.7.tar.gz

安装PIL
cd Imaging-1.1.7
sudo python setup.py install

安装图片格式支持
brew install libpng
brew install jpeg
brew install libtiff

(注:安装了libtiff后PIL仍然无法支持tiff格式的图片,原因还没搞清楚)

3.安装leptonica

brew install leptonica

4.安装tesseract-ocr

brew install tesseract

5.安装pytesseract库

安装pip工具
sudo easy_install pip

安装pytesseract
sudo pip install pytesseract

6.写python脚本并运行

import pytesseract
from PIL import Image

image = Image.open(‘yzm.png‘)
image.load()
image.split()
vcode = pytesseract.image_to_string(image)
print vcode

其中yzm.png为验证码图片,和py脚本同一个目录

py脚本保存为yzm.py,运行之

python yzm.py

显示结果

时间: 2024-10-28 10:07:20

[原]Python 使用pytesseract库识别验证码(MAC系统)的相关文章

python利用selenium库识别点触验证码

利用selenium库和超级鹰识别点触验证码(学习于静谧大大的书,想自己整理一下思路) 一.超级鹰注册:超级鹰入口 1.首先注册一个超级鹰账号,然后在超级鹰免费测试地方可以关注公众号,领取1000积分,基本上就够学习使用了.如果想一直用可以用,可以充值,不是很贵. 2.下载超级鹰的python库代码.代码 3.然后有测试案例,自己可以试着跑一跑代码. 二.使用selenium库来识别点触式验证码: 1.首先是找一个使用点触式二维码的网站:(这个真的是比较难找了,由于静谧大大书上的网站被封了,我找

python 标准日志模块loging 及日志系统实例

本文出处:https://www.cnblogs.com/goodhacker/p/3355660.html#undefined python的标准库里的日志系统从Python2.3开始支持.只要import logging这个模块即可使用.如果你想开发一个日志系统, 既要把日志输出到控制台, 还要写入日志文件,只要这样使用: 1 import logging 2 3 # 创建一个logger 4 logger = logging.getLogger('mylogger') 5 logger.s

python-使用内置库pytesseract实现图片验证码的识别

环境准备: 1.安装Tesseract模块 git文档地址:https://digi.bib.uni-mannheim.de/tesseract/ 百度网盘下载地址: 链接:https://pan.baidu.com/s/16RoJ19WynWOKI4Zpr0bKzA 提取码:5hst 下载后右击安装即可 2.配置环境变量: 编辑 系统变量里面 path,添加下面的安装路径:D:\Program Files\Tesseract-OCR(填写自己的实际安装路径) 3.安装python的第三方库:

Ubuntu上python识别验证码遇到的问题

python有专门图片识别的库我用的是pytesseract pytesseract说明 Python-tesseract is a wrapper for google's Tesseract-OCR( http://code.google.com/p/tesseract-ocr/ ). It is also useful as astand-alone invocation script to tesseract, as it can read all image typessupporte

【Mac + Python + Selenium】之获取验证码图片code并进行登录

初稿代码,可以忽略不计(自己留着看) #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2020/01/15 13:27 # @Author : zc # @File : 115test.py from selenium import webdriver from selenium.webdriver.common.by import By from time import sleep from PIL import Image,Im

python网络爬虫之如何识别验证码

有些网站的登录方式是验证码登录的方式,比如今天我们要测试的网站专利检索及分析. http://www.pss-system.gov.cn/sipopublicsearch/portal/uilogin-forwardLogin.shtml 登录此类网站的关键是识别其中的验证码.那么如何识别验证码呢.我们首先来看下网页源代码.在网页中,验证码的是通过下载一个图片得到的.图片的下载地址是src=/sipopublicsearch/portal/login-showPic.shtml 我们从实际的fi

使用python识别验证码

公司的登录注册等操作有验证码,测试环境可以让开发屏蔽掉验证码,但是如果到线上的话就要想办法识别验证码或必过验证码了. 识别验证码主要分为三部分,一.对验证码进行二值化.二.将二值化后的图片分割.三.进行识别.理论上在识别之前有一个标准化的操作,是将图片进行旋转等操作,尽量将字符弄成一样的格式,方便识别,避免随进图片的差异. 用这个验证码作为例子:.下面是代码: 一.打开图片,将图片二值化. 图片是由RGB三个通道组成的,图片的验证码和他的干扰,比如点或横线等,RGB的阙值有很大的区别,我们可以使

python识别验证码

1.python识别验证码依赖 tesseract-ocr-setup-3.02.02.exe,所以首先需要安装 tesseract-ocr-setup-3.02.02.exe 2.然后安装pytesseract,通过pytesseract调用tesseract-ocr来识别验证码.pip install pytesseract 运行代码: import requestsfrom PIL import Imagefrom StringIO import StringIOimport pytess

Python的常用库

读者您好.今天我将介绍20个属于我常用工具的Python库,我相信你看完之后也会觉得离不开它们.他们是: Requests.Kenneth Reitz写的最富盛名的http库.每个Python程序员都应该有它. Scrapy.如果你从事爬虫相关的工作,那么这个库也是必不可少的.用过它之后你就不会再想用别的同类库了. wxPython.Python的一个GUI(图形用户界面)工具.我主要用它替代tkinter.你一定会爱上它的. Pillow.它是PIL(Python图形库)的一个友好分支.对于用