python识别图片文字

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，而看视频是不可能看视频的，这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下：

手机屏幕投影到电脑上；
截图并识别图片文字；
调用百度来进行搜索；
提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、<a href="https://github.com/tesseract-ocr/tesseract">识别引擎tesseract-ocr</a>

要识别中文，ocr引擎要下载一个中文包<a href="https://github.com/tesseract-ocr/tesseract/wiki/Data-Files">chi_sim</a>放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
2 tesseract_cmd = ‘tesseract‘
3 tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe‘
4 img_mode = ‘RGB‘

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 import pyautogui as pag
2 x,y = pag.position()
3 posStr = "position:"+str(x).rjust(4)+‘,‘+str(y).rjust(4)
4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

 1 from PIL import Image
 2 from PIL import ImageGrab
 3 import pytesseract
 4 import webbrowser
 5
 6 pos = (0,245,425, 327)
 7 cut_img = ImageGrab.grab(pos)
 8 cut_img.save(‘C:/imgSave/1.jpg‘) #保存截图到文件夹中
 9 print("screenshots sucess")
10
11 text=pytesseract.image_to_string(Image.open(‘C:/imgSave/1.jpg‘),lang=‘chi_sim‘) #调用识别引擎识别
12 text=text.replace(" ","") #去空格
13 print(text)
14 url = ‘http://www.baidu.com/s?wd=%s‘ % text #调用百度搜索
15 webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，其实是懒。

原文地址：https://www.cnblogs.com/guolao/p/8900661.html

时间： 2025-01-12 15:32:09

python识别图片文字的相关文章

python 识别图片文字

今天群里有兄弟问如何把图片的文字给识别出来对于python来说这不是小菜一碟吗,于是乎让pupilheart狠狠的吹了一波(哈哈,竟然没懂),下面将整个实现过程给大家实现下: 方法一:自己搞定ORC (网上好多开源文件,课直接下载) 缺点:质量良莠不齐,适合自己玩,提升技术首先,安装两个依赖包,cmd命令下执行 pip install Image pip install pytesseract from PIL import Image import pytesseract text=pyt

微信怎么识别图片文字

微信怎么识别图片文字?微信拍照就能识别图片上的文字,抛弃那些APP解放手机的好方法你知道吗?相信很多人还不知道,那小编今天就将方法分享给大家吧. 迅捷文字识别属性:微信小程序优点:相机模式:对着文字进行拍照即可获取优质的识别和翻译.图片模式:选择已储存的图片,识别图片中的文字后可对结果进行英汉互译.结果编辑:翻译图片后,可以对识别内容进行编辑,如:复制.翻译.转发. 操作步骤: 1:首先打开微信,点击发现后在选择小程序. 2:先点击右上角的放大镜,然后在搜索框里输入需要的小程序名字. 3:找到

识别图片文字转换到Word中的操作方法

我们在工作中经常会接触到各式各样的文件,其中就有图片格式的,这种文件比较的特殊,一般难以进行编辑和修改,这个时候可以使用文字识别工具识别图片文字转换到Word,这样就很方便进行下一步的编辑修改了,具体怎样去操作呢?下面就一起来看下吧! 参考工具:迅捷OCR文字识别软件操作步骤: 1:先将所需识别的图片保存在电脑中的指定位置,接着将OCR文字识别软件打开,点击极速识别选项卡. 2:选择好对应功能后,就需要添加文件了,点击添加文件按钮添加. 3:图片添加完成后,将识别格式切换成DOCX,识别效果切

识别图片文字转换到Word文档中的方法

识别图片文字转换成Word常常发生在需要编辑图中文字的时候,那又该怎样去进行这一操作呢?下面小编就来为大家讲解下具体的操作流程,有需要的小伙伴们可以参考下. 参考工具:迅捷OCR文字识别软件操作步骤: 1:首先将所需识别的图片在电脑中准备好,接着下载安装一款支持图片文字识别转换的软件,帮助进行以下的操作. 2:打开迅捷OCR文字识别软件,打开后选择极速识别板块点击添加文件按钮将所需识别的图片添加进来. 3:图片添加进去后,将识别格式更改为DOCX,识别效果设置为识别优先. 4:可以提前软件左下

OCR软件怎样识别图片文字？

很多人知道OCR软件是一种办公软件,关于它的一些具体操作是不太了解的,那么大家在工作中有没有需要用到它的地方呢?答案是可想而知的,小编在工作中就有一些识别图片文字的任务需要完成,接下来将OCR软件识别图片文字的操作分享给大家!步骤一:首先,我们的电脑里需要安装一款OCR软件,在电脑上安装好我们需要的工具之后,直接双击一下桌面上识别图片文字工具的图标就可以了.步骤二:在该工具的页面中,我们可以看到有多种功能供我们选择,如极速识别,OCR文字识别中批量识别.手写文字识别.图片局部识别等.步骤三:在O

python之图片文字识别

总体思路: 1.借用热键截图,保存到本地 2.用百度的图片文字识别api,识别图中文字 import time import keyboard # 监控键盘事件pip install keyboard from PIL import ImageGrab # 能够去从剪切板当中把图片读取出来pip install pillow from aip import AipOcr #百度文字识别库 pip install baidu-aip # 上面的都是扩展包, 得安装 pip install pill

浅析点对点(End-to-End)的场景文字识别(图片文字)

一.背景随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的 (Camera-based)的应用更加强调对拍摄场景的理解.通常,在文字和其他物体并存的场景,用户往往首先更关注场景中的文字信息,因而如何能够正确识别场景中的文字,对用户拍摄意图会有更深入的理解.一般意义上,基于图像的文字识别包括基于扫描文字的光学字符识别(Optical Character Recognition, OCR) 和广泛用于网站注册验证的C

百度api识别图片文字

from selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom PIL import Image,ImageGrab,ImageEnhanceimport pytesseractimport time,osfrom pytesseract import *from numpy import *from scipy import *from aip import AipOcr #brower = w

Python配置图片文字识别

以管理员权限打开cmd控制台. 1.如何安装PIL 输入下面命令:pip install Pillow. 参考:https://www.cnblogs.com/mrgavin/p/8177841.html 2.安装pytesseract 输入下面命令:pip install pytesseract. 详细见下图: 3.安装文字识别包tesseract-ocr(https://www.cnblogs.com/hupeng1234/p/7136442.html) tesseract识别算法开源代码见