截图 文字识别

主:

import keyboard     #  键盘控制
from PIL import ImageGrab # 获取剪切板的文件
import time
import sys

from baidu import BaiDuAPI          #   自己写的 百度文字识别,

#  取图
def show_p():
    if keyboard.wait(‘ctrl + alt + a‘) == None:  # 截图
        if keyboard.wait(‘ctrl‘) == None:         # 告知程序截图完了,
            time.sleep(0.01)
            im = ImageGrab.grabclipboard()  # 获取剪切板的文件
            im.save(‘1.png‘)             # 保存剪切板图片,

if __name__ ==‘__main__‘:
    d = BaiDuAPI(‘co.ini‘)
    for _ in range(sys.maxsize):
        show_p()

    text = d.shi_bie(‘1.png‘)
    print(text)

  

百度文字识别

import configparser        #  读写配置文件
from aip import AipOcr    # pip install baidu-aip  百度文字识别

class BaiDuAPI( object ):       #  父类
    ‘‘‘用于文字识别‘‘‘
    def __init__(self,filePath):
        target = configparser.ConfigParser()

        #  将百度得到 KEY 写入 co.ini,
        target.read( filePath, encoding=‘utf-8-sig‘ )
        app_id = target.get(‘我的 KEY‘,‘APP_ID‘)
        api_key = target.get(‘我的 KEY‘,‘API_KEY‘)
        secret_key = target.get(‘我的 KEY‘,‘SECRET_KEY‘)
        self.client = AipOcr(app_id, api_key, secret_key)       # 百度提供

    @staticmethod       # 静态方法
    def get_a(filePath):
        ‘‘‘用于读取图片‘‘‘
        with open( filePath,‘rb‘ ) as f:
            return f.read()

    def shi_bie(self,filePath):
        ‘‘‘将图片成文字‘‘‘
        image = self.get_a(filePath)
        texts = self.client.basicGeneral(image)      #  百度提供
        # print(texts)
        # texts = texts[‘words_result‘][0][‘words‘]
        te = ‘‘
        for i in texts[‘words_result‘]:
            #        取到最后,如果没有 words 返回 空
            te = te + ‘‘.join(i.get(‘words‘,‘‘) )
        # print(te)
        return te

if __name__ ==‘__main__‘:
    d = BaiDuAPI(‘co.ini‘)
    text = d.shi_bie(‘1.png‘)
    print(text)

 

 百度文字识别中用到的 KEY,用 co.ini导入

[我的 KEY]
APP_ID = 123
API_KEY = abc
SECRET_KEY = jkl
;client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

  

原文地址:https://www.cnblogs.com/gdwz922/p/9249269.html

时间: 2024-11-08 04:34:38

截图 文字识别的相关文章

用百度ocr+微信截图实现文字识别

作用:将图片中的文字识别出来 一.调用微信截图dll控件 将微信截图插件复制到项目文件,使用ctypes加载(胶水语言就是给力) def capture(): try: dll = ctypes.cdll.LoadLibrary('PrScrn.dll') except Exception: print("Dll load error!") return else: try: dll.PrScrn(0) except Exception: print("Sth wrong i

文通视频文字识别亮相国际广播电影电视设备展览会(BIRTV2015)

 文通视频文字识别亮相国际广播电影电视设备展览会(BIRTV2015) 8月26日,第二十四届北京国际广播电影电视设备展览会(BIRTV2015)在北京盛大开幕,作为"亚洲最具影响力的盛会",4K.媒体融合.制播网络IP化.数字电影等广电领域一大批最新的技术和设备纷纷亮相,国内OCR行业领军企业北京文通科技有限公司的视频文字识别产品全面配装在合作伙伴产品中精彩亮相展览会,不仅解决了视频文字识别的难题,也大幅提高了视频检索效率,引发了广播电台.视频网站及政府舆情监控机构的广泛关注与称

TH-OCR 文通视频文字识别SDK

目前分辨率较低的网页视频截图,网页截图,广告截图,微博截图等是视频文字识别的难题,文通科技特别推出针对视频文字开发的识别引擎——TH-OCR 文通视频文字识别SDK ,完全解决了目前OCR产品对于视频文字无法识别的问题. 文通视频文字识别SDK具有强大的文字定位功能,可以精确定位到视频中的文字位置,定位后,再对所定位文字进行识别,识别结果完全能满足用户需求. TH-OCR 文通视频文字识别SDK功能介绍 支持TIFF.JPEG.PNG.BMP格式图像的读取: 支持avi.rmvb.rm.mp4.

浅析android OCR文字识别

这学期有门课程老师要求用JAVA实现一个OCR文字识别的程序,所以就花了一些时间研究了一下在安卓端如何实现 OCR的引擎是用的开源项目tesseract-ocr 这个安卓版的地址:https://code.google.com/p/tesseract-android-tools/ 但是自己在编译的时候老是出错,于是在网上寻找到了别人编译好安卓可用的tess-two导入到项目中(参考文章地址 http://www.cnblogs.com/hangxin1940/archive/2012/01/13

如何把图片上面的文字转换成word-OCR文字识别软件

解析如何把图片上面的文字转换成word 有没有小伙伴们为百度文库里面的资源下载需要下载券感到坑爹,特别是现下下载资源紧缺,各个网站配合网打的行动,导致很多优秀网站现在没法下载资源,尤其是新浪爱问共享资料,这么优秀的合作小伙伴就这么消失了,现在我只能依靠百度文库来下载资料了.可下载券的数目有限,现在都基本上用完了,想要的资料都必须要下载券,有些资料只能过过眼瘾,写论文的时候碰见好的资源,直接复制过来的文字格式又乱七八糟,重新整理让人很厌烦,基本上没弄几次我就放弃了.后来了解到有那种文字识别的软件可

CCBN2015在京举行视频文字识别产品受关注

 3月26日,以"融合智能网络 畅享数字生活"为主题的第二十三届中国国际广播电视信息网络展览会(CCBN2015)在北京举办,大会汇集了全球范围内数字电视与宽带网络方面的创新成果以及广电新业务的应用.设计与开发技术.国内OCR领军企业文通科技携视频文字识别产品亮相展览会,解决了视频文字识别的大难题,引发了广播电台.视频网站及政府舆情监控机构的广泛关注. 急速更新换代的信息技术加快了广播影视传统媒体的数字化.网络化.智能化进程,同时也给电视台.视频网站等节目制作播出监管机构等带来严峻

【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)

上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeNet的改进)做基本的文字识别,然后再根据项目需求,再尝试其他的网络结构.这次任务所使用的深度学习框架是强大

Android ORC文字识别之识别×××号等(附源码)

项目地址https://github.com/979451341/OrcTest 我们说说实现这个项目已实现的功能,能够截图手机界面的某一块,将这个某一块图片的Bitmap传给tess-two的代码来获取扫描结果 我这里在贴出tess-two这个专为Android而创建的文字识别框架的地址https://github.com/rmtheis/tess-two 接下来我就说我如何一步一步的实现项目 1.实现基础界面,我这里贴出已完成的界面 这样是为了模仿扫描二维码的界面,因为扫描×××号码或者是手

用图片文字识别软件 复制微信小助手的开票信息

微信目前有开票小助手的功能,可以保存开票信息,客户经常会发微信开票小助手里的截图,附带有个二维码,这边可以扫描二维码获取抬头,虽然听说有用二维码极速开票的,对于这个不清楚,也不打算了解,本人还是用的传统方式,开票信息也不算多,最多也就四条.刚开始的时候,如果客户发这种图,我会直接对照着手打,因为数据不是很多,如果不是很忙,没有其他事情,下单的时候还没给快递打电话,手打之后在一个个对照一下,确认后打出来,再对照一下,也没什么问题.后来,客户由于有时候下午下单,时间有时候比较晚,已经给顺丰打电话了,