Python基础系列讲解-自动控制windows桌面

在使用PC时与PC交互的主要途径是看屏幕显示、听声音,点击鼠标和敲键盘等等。在自动化办公的趋势下,繁琐的工作可以让程序自动完成。比如自动化测试、自动下单交易等。很多软件除了可以GUI方式操作外还可以用CLI接口操作,不过当一些软件未提供CLI接口时,我们应该怎么办呢?我们还可以用程序控制桌面上的窗口、模拟点击鼠标或按下键盘等动作来释放自己。

pywin32是一个Python库,它为Python提供访问Windows API的扩展,提供了齐全的windows常量、接口、线程以及COM机制等等,安装后会自带一个pythonwin的IDE。接下来主要介绍下如何通过Python去操作windows桌面软件。

1、打开软件或文件 ,比如打开一个谷歌浏览器,或者打开一个word文件,如下所示:

win32api.ShellExecute(1, ‘open‘, r‘C:Program Files (x86)GoogleChromeApplicationchrome.exe‘, ‘‘, ‘‘, 1)win32api.ShellExecute(1, ‘open‘, r‘C:UsersJayDesktopEnvironment Guider.docx‘, ‘‘, ‘‘, 1)

win32api.ShellExecute()的参数主要包括:

HWND:指定父窗口句柄

Operation:指定动作, 譬如"edit",“explore”,“open”,“find”,“print”,“NULL”

FileName:指定要打开的文件或程序

Parameters:指定打开程序所需参数

Directory:缺省目录

ShowCmd:打开选项,可选值:

  • •SW_HIDE = 0; {隐藏窗口,活动状态给令一个窗口}
  • •SW_SHOWNORMAL = 1; {用最近的大小和位置显示窗口, 同时令其进入活动状态}
  • •SW_NORMAL = 1; {用当前的大小和位置显示一个窗口,不改变活动窗口}
  • •SW_SHOWMINIMIZED = 2; {最小化窗口,并将其激活}
  • •SW_SHOWMAXIMIZED = 3; {最大化窗口,并将其激活}
  • •SW_MAXIMIZE = 3; {同 SW_SHOWMAXIMIZED}
  • •SW_SHOWNOACTIVATE = 4; {用最近的大小和位置显示一个窗口,不改变活动窗口}
  • •SW_SHOW = 5; {用当前的大小和位置显示一个窗口,令其进入活动状态}
  • •SW_MINIMIZE = 6; {最小化窗口, 不激活}
  • •SW_SHOWMINNOACTIVE = 7; {同 SW_MINIMIZE}
  • •SW_SHOWNA = 8; {用当前的大小和位置显示一个窗口,不改变活动窗口}
  • •SW_RESTORE = 9; {同 SW_SHOWNORMAL}
  • •SW_SHOWDEFAULT = 10; {同 SW_SHOWNORMAL}
  • •SW_MAX = 10; {同 SW_SHOWNORMAL}

执行成功会返回应用程序句柄, 如果返回值 <= 32,则表示执行错误。返回值可能的错误有:

0—— {内存不足}

2—— {文件名错误}

3—— {路径名错误}

11—— {EXE 文件无效}

26—— {发生共享错误}

27—— {文件名不完全或无效}

28—— {超时}

29—— {DDE 事务失败}

30—— {正在处理其他 DDE 事务而不能完成该 DDE 事务}

31—— {没有相关联的应用程序}

2、查找窗体的句柄。在win32编程的世界里,包括窗口到文本框的所有控件都是窗体,所有的窗体都有独立的句柄。要操作任意一个窗体,都需要找到这个窗体的句柄。句柄是一个32位整数,在windows中用于标记对象。比如查找Snipping Tool和New Text Document.txt的句柄,如下所示:

para_hld = win32gui.FindWindow(None, "Snipping Tool")# 1836416para_hld = win32gui.FindWindow(None, "New Text Document.txt - Notepad")# 591410

win32gui.FindWindow()属于win32gui的模块,它自顶层窗口(也就是桌面)开始搜索条件匹配的窗体,并返回这个窗体的句柄。该函数仅能查找主窗口,因此无法搜索子窗口,也不区分大小写,未找到则返回0。

win32gui.FindWindow()的参数主要包括 (lpClassName=None, lpWindowName=None):

•lpClassName:字符型,窗体的类名,可以在Spy++里找到

•lpWindowName:字符型,窗口名,也就是标题栏上能看见的那个标题。

3、查找句柄的类名和标题。比如通过Snipping Tool和New Text Document.txt的句柄查找对应的类名和标题,如下所示:

title = win32gui.GetWindowText(1836416)classname = win32gui.GetClassName(1836416)print "windows handler:{0}; title:{1}; classname:{2}".format(1836416, title, classname)

打印显示如下:

windows handler:1836416; title:Snipping Tool; classname:Microsoft-Windows-Tablet-SnipperToolbartitle = win32gui.GetWindowText(591410)classname = win32gui.GetClassName(591410)print "windows handler:{0}; title:{1}; classname:{2}".format(591410, title, classname)

打印显示如下:

windows handler:591410; title:New Text Document.txt - Notepad; classname:Notepad

4、调用win32gui.EnumWindows()枚举所有窗口句柄,直到最后一个顶层窗口被枚举则停止枚举过程。如下所示:

hWndList = []win32gui.EnumWindows(lambda hWnd, param: param.append(hWnd), hWndList)print hWndListfor hwnd in hWndList: title = win32gui.GetWindowText(hwnd) print title

打印显示如下:

[852802L, 65946L, 65928L, 65930L, 65900L, 65920L, 65924L, 65922L, 65944L, 65892L, 65886L, 6817870L, 65960L, 6031410L, …… 66052L, 65734L]……New Text Document.txt - NotepadSnipping ToolDDE Server WindowOfficePowerManagerWindowOfficePowerManagerWindowDDE Server WindowGDI+ WindowGlobal Internet Access……

5、win32gui.SetForegroundWindow()函数将指定窗体设置到最顶层,并且激活该窗口。

构造函数为:win32gui.SetWindowPos(HWN hWnd,HWND hWndlnsertAfter, int X,int Y, int cx,int cy, UNIT.Flags)

关于win32gui.SetForegroundWindow(para_hld)报错的问题:

pywintypes.error: (0, ‘SetForegroundWindow’, ‘No error message is available’)

其实调用SetForegroundWindow()会有很多限制,参考官网的说明:https://docs.microsoft.com/en-us/windows/desktop/api/winuser/nf-winuser-setforegroundwindow

因此调用SetForegroundWindow()时需要查看当前运行的条件是否符合上述要求,此处在调用SetForegroundWindow()前事先发送一个键盘event来解决该问题。

例程如下所示:

win32api.keybd_event(13, 0, 0, 0) #win32gui.SetForegroundWindow(para_hld)

6、win32api.keybd_event()模拟键盘输入。

构造函数如下所示:

win32api.keybd_event (bVk, bScan, dwFlags, dwExtraInfo)

•bVk:虚拟键码(键盘键码对照表见附录);

•bScan:硬件扫描码,一般设置为0即可;

•dwFlags:函数操作的一个标志位,如果值为KEYEVENTF_EXTENDEDKEY则该键被按下,也可设置为0即可,如果值为KEYEVENTF_KEYUP则该按键被释放;

•dwExtraInfo:定义与击键相关的附加的32位值,一般设置为0即可。

按下enter键后抬起的例程如下所示:

win32api.keybd_event(13,0,0,0) # enterwin32api.keybd_event(13,0,win32con.KEYEVENTF_KEYUP,0) #释放按键

7、模拟鼠标输入。直接给出例程,如下所示:

# 获取鼠标当前位置的坐标print win32api.GetCursorPos()# 将鼠标移动到坐标处win32api.SetCursorPos((100, 100))# 左点击win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN, 100, 100, 0, 0)time.sleep(2)win32api.mouse_event(win32con.MOUSEEVENTF_LEFTUP, 100, 100, 0, 0)

8、关于鼠标键盘的操作还可以使用PyUserInput库。PyUserInput是一个使用python的跨平台的操作鼠标和键盘的模块,使用非常方便。支持的平台及依赖如下:

•Linux - Xlib

•Mac - Quartz, AppKit

•Windows - pywin32, pyHook

实例化一个鼠标和键盘对象,如下所示:

from pymouse import PyMousefrom pykeyboard import PyKeyboardm = PyMouse()k = PyKeyboard()操作鼠标和键盘,如下所示:m.click(190,70,1)#移动并且在xy位置点击time.sleep(2)m.click(190, 200, 1)#移动并且在xy位置点击time.sleep(2)k.tap_key(k.function_keys[5])#–点击功能键F5

伙伴们哪里有不清楚的地方,可以留言哦!

原文地址:https://www.cnblogs.com/cherry-tang/p/11164612.html

时间: 2024-10-10 09:41:32

Python基础系列讲解-自动控制windows桌面的相关文章

Python基础系列讲解——时间模块详解大全之time模块

Python中提供处理时间日期相关的内置模块有time.datetime和calendar. time模块中大多数函数调用了所在平台C library 的同名函数,因此更依赖于操作系统层面,所以time模块的有些函数与平台相关,在不同的平台上可能会有不同的效果,这点需要特别注意下,即time模块的功能并不适用于所有平台. 使用时需要导入time模块,如下所示: import time time模块的时间表现的格式主要有以下三种: timestamp时间戳.时间戳表示的是从新纪元开始按秒计算的偏移

python基础系列教程——Python3.x标准模块库目录

python基础系列教程——Python3.x标准模块库目录 文本 string:通用字符串操作 re:正则表达式操作 difflib:差异计算工具 textwrap:文本填充 unicodedata:Unicode字符数据库 stringprep:互联网字符串准备工具 readline:GNU按行读取接口 rlcompleter:GNU按行读取的实现函数 二进制数据 struct:将字节解析为打包的二进制数据 codecs:注册表与基类的编解码器 数据类型 datetime:基于日期与时间工具

python基础系列(二)----各数据类型的详细方法描述

python基础 一.整数 1 class int(object): 2 """ 3 int(x=0) -> int or long 4 int(x, base=10) -> int or long 5 6 Convert a number or string to an integer, or return 0 if no arguments 7 are given. If x is floating point, the conversion truncate

Python基础系列----序列(列表、元组、字符串)

1.定义                                                                                               1.数据结构:通过某种方式组织在一起的数据元素的集合.这些数据元素可以说数字或者字符,甚至可以是其他数据结构.在python中,最基本的数据结构是序列. 2.索引:序列中的每个元素被分配一个序号.注意索引默认从0开始. 在python中,内建了6中序列:列表.元组.字符串.unicode字符串.buf

Python基础系列----字典、基本语句

1.定义                                                                                               映射:通过名字来引用的数据结构.与前面说的数据结构不同,一个是通过下标的数字,一个是通过名称. 字典是python中唯一内建的映射类型.字典中的值并没有特殊的顺序,但都是存储在一个特定的键下.键可以是数字.字符甚至是元组. 字典由多个键及其对应的值构成的键-值对组成. 1 phonebook={'To

Python | 基础系列 &#183;?Python为什么没有switch/case语句?

与我之前使用的所有语言都不同,Python没有switch/case语句.为了达到这种分支语句的效果,一般方法是使用字典映射: def numbers_to_strings(argument): switcher = { 0: "zero", 1: "one", 2: "two", } return switcher.get(argument, "nothing") 这段代码的作用相当于: function(argument)

Python 基础系列一:初识python(二)拾遗

基本数据类型 1.整型(int) 创建方式: n1 = 123 # 根据int类,创建了一个对象 n2 = int(123) # 根据int类,创建了一个对象 int内部优化n1,n2 共享同一块内存,  Python中的int对象就是c语言中long类型数值的扩展 小整数对象[-5, 257]在python中是共享的 整数对象都是从缓冲池中获取的. 2.字符串(str) 创建方式 s1 = "hello" s1 = str('hello') 字符串(str)类型和bytes类型转换p

Python 基础系列一:初识python(三)

三元运算 三元运算符通常在Python里被称为条件表达式,这些表达式基于真(true)/假(not)的条件判断,在Python 2.4以上才有了三元操作. 语法格式: X if C else Y 有了三元表达式,你只需一行就能完成条件判断和赋值操作: x, y = 3, 4 if x<y : smaller= x else smaller =y 现在 只需一句: smaller = x if x<y else y 基本数据类型补充之 set set集合,是一个无序且不重复的元素集合. 创建se

python基础系列二:列表

#-----------------------------------------创建列表------------------------------------------# 定义# 直接定义nums = [1,2,3,4,5] # 通过range函数构造,python2 和python3 版本之间的差异:# python3 用的时候才会去构造nums = range(1,101) # 列表嵌套# 注意和C语言中数组的区别,是否可以存放不同的数据类型nums = [1,2,"ab"