安卓手机 Python 自动化( uiautomation、uiautomation2、weditor )

article/2025/10/15 4:38:32

其他自动化工具或者框架:

  • Airtest:https://airtest.readthedocs.io/zh_CN/latest/
  • autojs:Auto.js快速入门实战教程:https://zhuanlan.zhihu.com/p/90065914
  • appium:https://blog.csdn.net/freeking101/article/details/107881979

AutomateIt、Automate、按键精灵、AutoJS 等 Android 自动化工具有什么特点?:https://www.zhihu.com/question/59503646

1、uiautomation

From:https://blog.csdn.net/ma524654165/article/details/77686526

        主要用到一个 uiautomation 的开源框架,是一个国人用 Python 封装 Windows GUI (UI Automation) 而成的自动化工具;

开源作者原文:http://www.cnblogs.com/Yinkaisheng/p/3444132.html

Github 地址:https://github.com/yinkaisheng/Python-UIAutomation-for-Windows

此自动化的主要思想:利用此框架抓取到程序的各种句柄,然后对句柄执行各种操作

一、uiautomation 方法

  • 1、WindowContrl(searchDepth,ClassName,SubName)
            查找窗口中的程序,如果有中文则需用Unicode;可用window.Exists(maxSearchSeconds)来判断此窗口是否存在;
  • 2、EditControl(searchFromControl)
            查找编辑位置,找到后可用DoubleClick()来改变电脑的focus;edit.SetValue("string")输入值;
  • 3、Win32API.SendKeys("string") 
            如果已在编辑位置,则可用此方法来输入值,{Ctrl}为ctrl键,其他类似;{@  8}格式可输入8个@,
            对于数字也可实现此功能,但对于字母不能...;
  • 4、MenuItemControl(searchFromControl,Name)                   查找菜单按钮;
  • 5、ComboBoxControl(searchFromControl,AutomationI)      
            查找下拉框,然后在此基础上用Select("name")方法来选择需要的选项;
  • 6、BottonControl(searchFromControl,Name,SubName)        查找按钮;
  • 7、automation.FindControl(firefoxWindow,lambda c:(isinstance(c, automation.EditControl) or isinstance(c, automation.ComboBoxControl)) and c.Name == 'Enter your search term')   按条件搜索handle

二、对找到句柄常用操作

  • Click()            点击;
  • RighClik()       右键点击;
  • SendKeys()     发送字符;
  • SetValue()      传值,一般对EditControl用;

三、对 windows 程序常用操作

  • subprocess.Popen('Name')    用进程打开程序;
  • window.Close()            关闭窗口;
  • window.SetActive()           使用;
  • window.SetTopMost()       设置为顶层
  • window.ShowWindow(uiautomation.ShowWindow.Maximize)  窗口最大化
  • window.CaptureToImage('Notepad.png')  截图;
  • uiautomation.Win32API.PressKey(uiautomation.Keys.VK_CONTROL)    按住Ctrl键
  • uiautomation.Win32API.ReleaseKey(uiautomation.Keys.VK_CONTROL) 释放Ctrl键
  • automation.GetConsoleWindow()      #return console window that runs python,打开控制台
  • automation.Logger.ColorfulWriteLine('\nI will open <Color=Green>Notepad</Color> and <Color=Yellow>automate</Color> it. Please wait for a while.')  控制台传值(彩色字体),普通传值用WriteLine;
  • automation.ShowDesktop() 显示桌面;

四、句柄的抓取

直接运行 automation 模块枚举窗口时,支持下列参数(从 doc 窗口运行 automation.py 程序 ):

-t intValue     延迟枚举时间,单位秒
-r              从树的根部枚举,如果不指定,从当前窗口枚举
-d intValue     枚举控件树的的深度,如果不指定,枚举整个树
-f              从焦点控件枚举,如果不指定,从当前窗口枚举
-c              从光标下的控件枚举,如果不指定,从当前窗口枚举
-a              获取光标下控件及其所有父控件
-n              显示控件的完整Name, 如果不指定,只显示前30个字符
-m              显示控件更多属性,默认只显示控件的四个属性

示例:

automation.pyc –t3,             3秒后枚举当前窗口所有控件
automation.pyc –d2 –t3,         3秒后枚举当前窗口前三层控件
automation.pyc –r –d1 –t0 -n,   0秒后从根部枚举前两层控件,并显示控件完整名称
automation.pyc –c –t3,          3秒后显示鼠标光标下面的控件信息

2、UIAutomator2

参考

  • :https://vic.kim/2019/05/20/UIAutomator2的使用/
  • :https://blog.csdn.net/d1240673769/article/details/113809889

uiautomator2 是一个可以使用 Python 对 Android 设备进行UI自动化的库。其底层基于 Google uiautomator,Google 提供的 uiautomator 库可以获取屏幕上任意一个 APP 的任意一个控件属性,并对其进行任意操作。

uiautomator2 不是 android SDK 下的 uiautomator,而是一个 python 库,用于 Android 的 ui 自动化测试。使用 uiautomator2 只能用于 android 端测试,不像 appium 可以跨平台可用于 ios 端。使用 uiautomator2 可以使用 wifi 或数据线和手机相连。

GitHub地址:https://github.com/openatx/uiautomator2https://github.com/openatx/uiautomator2/blob/master/README.md

工作原理:

如图所示,python-uiautomator2 主要分为两个部分,python 客户端移动设备

  • Python端:运行脚本,并向移动设备发送 HTTP 请求
  • 移动设备:移动设备上运行了封装了 uiautomator2 的 HTTP 服务,解析收到的请求,并转化成 uiautomator2 的代码。

整个过程

  1. 在移动设备上安装 atx-agent (守护进程), 随后 atx-agent 启动 uiautomator2 服务 ( 默认7912端口 ) 进行监听
  2. 在 PC 上编写测试脚本并执行( 相当于发送 HTTP 请求到移动设备的 server 端)
  3. 移动设备通过 WIFI 或 USB 接收到 PC 上发来的 HTTP 请求,执行制定的操作

安装 uiautomator2

pip install --pre uiautomator2 
pip install pillow (如果需要截图,可安装这个库)

设备安装 atx-agent

首先设备连接到 PC,并能够 adb devices 发现该设备。
执行下面的命令

# init就是所有USB连接电脑的手机上都安装uiautomator2
python -m uiautomator2 init# 指定手机安装uiautomator2, 用 --mirror
python -m uiautomator2 init --mirror --serial $SERIAL# 嫌弃慢的话,可以用国内的镜像
python -m uiautomator2 init --mirror

然后就会自动安装库所需要的设备端程序:uiautomator-server,atx-agent,openstf / minicap,openstf / minitouch。 最后提示 success,代表 atx-agent 初始化成功。

安装 weditor

有了这个,方便我们快速的识别手机上的元素,方便写代码

pip install -U weditor

安装好之后,就可以在命令行运行 weditor --help 确认是否安装成功了。Windows 系统可以使用命令在桌面创建一个快捷方式:weditor --shortcut  ,在 windows cmd 中执行上述命令后,会在桌面上创建一个快捷方式,如下图:

安装 weditor 报错 UnicodeDecodeError 时,可以安装老版本:pip install weditor==0.6.3

启动方法

  • 方法 1:命令行执行 weditor 会自动打开浏览器,输入 设备的IP 或者 序列号( 序列号可以通过 adb devices 命令查看得到 ),然后点击 Connect
  • 方法 2:桌面上双击 WEditor 快捷方式即可。
  • 方法 3:命令行中执行 python -m weditor

启动后如下图:

应用以及操作

调用 uiautomator2 的过程

配置手机设备参数,设置具体操作的是哪一台手机
抓取手机上应用的控件,制定对应的控件来进行操作
对抓取到的控件进行操作,比如点击、填写参数等。

设备连接方法,有两种

python-uiautomator2 连接手机的方式有两种,

  • 一种是通过WIFI。WIFI 最便利的地方是可以不用连接数据线
  • 一种是通过USB。USB则可以用在PC和手机网络不在一个网段用不了的情况。

(1)通过WiFi,假设设备IP 192.168.0.107和您的PC在同一网络中

import uiautomator2 as u2
d = u2.connect('192.168.0.107')

(2)通过USB, 假设设备序列是123456789F

import uiautomator2 as u2
d = u2.connect('123456789F') # USB链接设备。或者u2.connect_usb('123456f')
#d = u2.connect_usb() 或者 d = u2.connect()  ,当前只有一个设备时可以用这个

在没有参数的情况下调用 u2.connect(), uiautomator2 将从环境变量 ANDROID_DEVICE_IP 获取设备 IP。如果这个环境变量是空的,uiautomator 将返回 connect_usb,您需要确保只有一个设备连接到计算机。

检查并维持设备端守护进程处于运行状态:

d.healthcheck()

打开调试开关:

d.debug = True
d.info

安装应用,只能从URL安装:

d.app_install('http://some-domain.com/some.apk')  #引号内为下载apk地址

启动应用:

d.app_start('com.eg.android.AlipayGphone')  #引号内为包名称,这里为支付宝

停止应用:

#相当于'am force-stop'强制停止应用
d.app_stop('com.eg.android.AlipayGphone') #相当于'pm clear' 清空App数据
d.app_clear('com.eg.android.AlipayGphone')

停止所有正在运行的应用程序:

# 停止所有
d.app_stop_all()# 停止所有应用程序,除了com.examples.demo
d.app_stop_all(excludes=['com.examples.demo'])

跳过弹窗,禁止弹窗:

d.disable_popups()   # 自动跳过弹出窗口 
d.disable_popups(False)  # 禁用自动跳过弹出窗

获取设备信息:

# 获取基本信息
d.info# 获取窗口大小
print(d.window_size())
# 设备垂直输出示例: (1080, 1920)
# 设备水平输出示例: (1920, 1080)# 获取当前应用程序信息。对于某些android设备,输出可以为空
print(d.current_app())#获取设备序列号
print(d.serial)#获取WIFI IP
print(d.wlan_ip)#获取详细的设备信息
print(d.device_info)

获取应用信息:

d.app_info("com.eg.android.AlipayGphone")
# 会输出
'''
{"packageName": "com.eg.android.AlipayGphone", "mainActivity": "com.eg.android.AlipayGphone.AlipayLogin", "label": "支付寶", "versionName": "10.2.13.9020", "versionCode": 360, "size": 108306104
}
'''
# 保存应用程序图标
img = d.app_icon("com.eg.android.AlipayGphone")
img.save("icon.png")

推拉文件:

(1)将文件推送到设备

# push文件夹
d.push("foo.txt", "/sdcard/")
# push和重命名
d.push("foo.txt", "/sdcard/bar.txt")
# push fileobj
with open("foo.txt", 'rb') as f:d.push(f, "/sdcard/")
# 推动和更改文件访问模式
d.push("foo.sh", "/data/local/tmp/", mode=0o755)

(2)从设备中拉出一个文件

d.pull("/sdcard/tmp.txt", "tmp.txt")# 如果在设备上找不到文件,FileNotFoundError将引发
d.pull("/sdcard/some-file-not-exists.txt", "tmp.txt")

关键事件 ( 屏幕键盘 操作 ):

(1)打开/关闭屏幕

d.screen_on()#打开屏幕 
d.screen_off() #关闭屏幕

(2)获取当前屏幕状态

d.info.get('screenOn')  # 需要 Android> = 4.4

(3)硬键盘和软键盘操作

d.press("home") # 点击home键
d.press("back") # 点击back键
d.press("left") # 点击左键
d.press("right") # 点击右键
d.press("up") # 点击上键
d.press("down") # 点击下键
d.press("center") # 点击选中
d.press("menu") # 点击menu按键
d.press("search") # 点击搜索按键
d.press("enter") # 点击enter键
d.press("delete") # 点击删除按键
d.press("recent") # 点击近期活动按键
d.press("volume_up") # 音量+
d.press("volume_down") # 音量-
d.press("volume_mute") # 静音
d.press("camera") # 相机
d.press("power") #电源键

(4)解锁屏幕

d.unlock()
# 相当于
# 1. 发射活动:com.github.uiautomator.ACTION_IDENTIFY
# 2. 按home键

手势与设备的交互:

# 单击屏幕
d.click(x,y)  # x,y为点击坐标# 双击屏幕
d.double_click(x,y)
d.double_click(x,y,0.1) # 默认两个单击之间间隔时间为0.1秒# 长按
d.long_click(x,y)
d.long_click(x,y,0.5)  # 长按0.5秒(默认)# 滑动
d.swipe(sx, sy, ex, ey)
d.swipe(sx, sy, ex, ey, 0.5) #滑动0.5s(default)#拖动
d.drag(sx, sy, ex, ey)
d.drag(sx, sy, ex, ey, 0.5)#拖动0.5s(default)
# 滑动点 多用于九宫格解锁,提前获取到每个点的相对坐标(这里支持百分比)# 从点(x0, y0)滑到点(x1, y1)再滑到点(x2, y2)
# 两点之间的滑动速度是0.2秒
d.swipe((x0, y0), (x1, y1), (x2, y2), 0.2)
# 注意:单击,滑动,拖动操作支持百分比位置值。例:
d.long_click(0.5, 0.5) 表示长按屏幕中心

XPath:

# 检索方向
d.orientation
# 检索方向。输出可以是 "natural" or "left" or "right" or "upsidedown"# 设置方向
d.set_orientation("l") # or "left"
d.set_orientation("r") # or "right"
d.set_orientation("n") # or "natural"#冻结/ 开启旋转
d.freeze_rotation() # 冻结旋转
d.freeze_rotation(False) # 开启旋转########## 截图 ############
# 截图并保存到电脑上的一个文件中,需要Android>=4.2。
d.screenshot("home.jpg")# 得到PIL.Image格式的图像. 但你必须先安装pillow
image = d.screenshot() # default format="pillow"
image.save("home.jpg") # 或'home.png',目前只支持png 和 jpg格式的图像# 得到OpenCV的格式图像。当然,你需要numpy和cv2安装第一个
import cv2
image = d.screenshot(format='opencv')
cv2.imwrite('home.jpg', image)# 获取原始JPEG数据
imagebin = d.screenshot(format='raw')
open("some.jpg", "wb").write(imagebin)############################## 转储UI层次结构
# get the UI hierarchy dump content (unicoded).(获取UI层次结构转储内容)
d.dump_hierarchy()# 打开通知或快速设置
d.open_notification()  #下拉打开通知栏
d.open_quick_settings()  #下拉打开快速设置栏# 检查特定的UI对象是否存在
d(text="Settings").exists # 返回布尔值,如果存在则为True,否则为False
d.exists(text="Settings") # 另一种写法
# 高级用法
d(text="Settings").exists(timeout=3) # 等待'Settings'在3秒钟出现# 获取特定UI对象的信息
d(text="Settings").info# 获取/设置/清除可编辑字段的文本(例如EditText小部件)
d(text="Settings").get_text()  #得到文本小部件
d(text="Settings").set_text("My text...")  #设置文本
d(text="Settings").clear_text()  #清除文本# 获取Widget中心点
d(text="Settings").center()
#d(text="Settings").center(offset=(0, 0)) # 基准位置左前

UI 对象 的 五种 定位方式:

# text、resourceId、description、className、xpath、坐标# 执行单击UI对象
#text定位单击
d(text="Settings").click()
d(text="Settings", className="android.widget.TextView").click()#resourceId定位单击
d(resourceId="com.ruguoapp.jike:id/tv_title", className="android.widget.TextView").click() #description定位单击
d(description="设置").click()
d(description="设置", className="android.widget.TextView").click()#className定位单击
d(className="android.widget.TextView").click()#xpath定位单击
d.xpath("//android.widget.FrameLayout[@index='0']/android.widget.LinearLayout[@index='0']").click()#坐标单击
d.click(182, 1264)# 等待元素出现(最多10秒),出现后单击 
d(text="Settings").click(timeout=10)
# 在10秒时点击,默认的超时0
d(text='Skip').click_exists(timeout=10.0)
# 单击直到元素消失,返回布尔
d(text="Skip").click_gone(maxretry=10, interval=1.0) # maxretry默认值10,interval默认值1.0
# 点击基准位置偏移
d(text="Settings").click(offset=(0.5, 0.5)) # 点击中心位置,同d(text="Settings").click()
d(text="Settings").click(offset=(0, 0)) # 点击左前位置
d(text="Settings").click(offset=(1, 1)) # 点击右下# 执行双击UI对象
d(text="设置").double_click() # 双击特定ui对象的中心
d.double_click(x, y, 0.1)  # 两次单击之间的默认持续时间为0.1秒#执行长按UI对象
# 长按特定UI对象的中心
d(text="Settings").long_click()
d.long_click(x, y, 0.5) # 长按坐标位置0.5s默认# 将UI对象拖向另一个点或另一个UI对象
# Android<4.3不能使用drag.
# 在0.5秒内将UI对象拖到屏幕点(x, y)
d(text="Settings").drag_to(x, y, duration=0.5)# 将UI对象拖到另一个UI对象的中心位置,时间为0.25秒
d(text="Settings").drag_to(text="Clock", duration=0.25)

常见用法:

# 等待10s
d.xpath("//android.widget.TextView").wait(10.0)# 找到并单击
d.xpath("//*[@content-desc='分享']").click()# 检查是否存在
if d.xpath("//android.widget.TextView[contains(@text, 'Se')]").exists:print("exists")# 获取所有文本视图文本、属性和中心点
for elem in d.xpath("//android.widget.TextView").all():print("Text:", elem.text)#获取视图文本
for elem in d.xpath("//android.widget.TextView").all():print("Attrib:", elem.attrib)#获取属性和中心点
#返回: (100, 200)
for elem in d.xpath("//android.widget.TextView").all():print("Position:", elem.center())# xpath常见用法:
# 所有元素
//*# resource-id包含login字符
//*[contains(@resource-id, 'login')]# 按钮包含账号或帐号
//android.widget.Button[contains(@text, '账号') or contains(@text, '帐号')]# 所有ImageView中的第二个
(//android.widget.ImageView)[2]# 所有ImageView中的最后一个
(//android.widget.ImageView)[last()]# className包含ImageView
//*[contains(name(), "ImageView")]

会在浏览器中打开网页,输入设备 devices 信息 可以 通过 adb devices 来进行查询设备 信息。出现树的模样,代表链接上手机,然后点击右上角的 Reload 实时显示手机页面。 这样就可以开始你的元素定位了。

通用的元素定位方式。

  • (1) 根据文本进行定位:d(text=显示的文本).click()
  • (2) 通过 resourceId 进行定位:d(resourceId="com.tcl.tclplus:id/cart_layout").click()
  • (3) 滑动 上 或者 下 。手指向上,就是页面往下拉,分两种情况 拉到底 或者 只拉一部分。
    • 拉到底:d(scrollable=True).scroll.toEnd()
    • 拉一部分:d.swipe(0.806, 0.801,0.818, 0.487) # 向上滑动  横坐标可以不变,纵坐标是变化的,是变小的趋势  这是手指向上
    • 拉倒页面首页 开头部分:d(scrollable=True).scroll.toBeginning(steps=50)
  • (4) 滑动 左右 d(scrollable=True).scroll.horiz.toEnd() #横向滚动到最右侧d(scrollable=True).scroll.horiz.toBeginning() #横向滚动到最左侧
        或者
            c.水平向右滚动:d(scrollable=True).scroll.horiz.forward(steps=50)
            d.水平向左滚动:d(scrollable=True).scroll.horiz.backward(steps=50)
  • (5) 滑动到指定位置:滑动到文本为测试的位置:d(scrollable=True).scroll.to(text ='测试')
  • (6) 元素判断  可以这样写,通过判断元素的存在性来执行不同的操作
    s = self.d(resourceId="com.tcl.tclplus:id/iot_txt_home_name", text=u"立即登录", className="android.widget.TextView"
    )
    if len(s) == 0:print('元素未找到,执行退出操作')
  • (7) 随机字符串或者随机字母 输入
    a = random.sample(string.ascii_letters, 4)
    data = ''.join([str(x) for x in a])
    # 随机从大小写字母中取四位,然后写入到输入框中。
    d(resourceId="com.tcl.tclplus:id/et_invoice_header").set_text(data)
  • (8) 截图
    filepaths 就是截图所存的路径,可以自己填写。filepaths = os.path.normpath(os.path.join(os.path.join(os.path.dirname(os.path.dirname(__file__)), "Automation/Tcase")))
    def get_png(self, filename, filepath='/Member'):"""截图操作,默认截图的存储路径为Member"""imgName = filename + datetime.datetime.now().strftime('%Y%m%d%H%M%S') + '.png'  # 截图可以单独保存为别的名字的文件stringPath = filepaths + '/image' + filepath + '\\' + imgNameprint stringPath# img.save('filename.png')#图片保存在当前项目的文件夹下边self.d.screenshot().save(stringPath)  # 保存文件到指定的文件夹下边self.get_png(filename='订单-取消购买'.decode('utf-8'), filepath='/Market/订单')  实际调用的时候 需要进行decode
  • (9) apk 自动安装
    def install_app(path):app_Path = lambda x: os.path.join(file_path, "app", x)apk = app_Path(path + ".apk")os.system('adb install -r -d ' + apk)time.sleep(5)
  • (10) 报告生成
    # 用例文件很多 采用 关键字匹配的方式进行。def UI_Report(testcase, ReportPath):"""根据传入的testcase 来判断执行哪种报告生成方式。"""def Report(s):@wraps(s)def creat_report():AA = hasattr(testcase,'__call__')# AA = isfunction(testcase)if AA:print '这个是函数'suite = unittest.makeSuite(testcase)fp = file(ReportPath, 'wb')runner = HTMLTestRunner(stream=fp, title=r'UI自动化', description=r'接口自动化测试报告')runner.run(suite) #区别fp.close()else:print '不是函数,是执行run_main方法'fp = file(ReportPath, 'wb')runner = HTMLTestRunner(stream=fp, title=r'UI自动化测试报告', description=r'商城')runner.run(testcase)fp.close()return creat_reportreturn Reportdef all_case():testcase = unittest.TestSuite()  # 加载测试套件# 用例的目录,关键字进行匹配discover = unittest.defaultTestLoader.discover(filepath, pattern='Market*.py', top_level_dir=None)testcase.addTest(discover)return testcase@UI_Report(testcase=all_case(),ReportPath=filepath+'/report/result.html')
    def run():print '生成测试报告'if __name__ == '__main__':run()

    因为 run_main 执行的时候,是打印所有用例文件+名称,而通过测试套件 添加 类名称时,执行方式不一样。至于公共函数,比如启动 app、一些共有的操作,可以写到 公共函数中

     在unitest中 增加setupclass 函数 是只 启动一次app,跟setup 区别一下,下面增加你的公共函数。然后用例文件中 直接通过继承的方式来进行。

例如:class test(commons):

def del_file(filepath):listdir = os.listdir(filepath)  # 获取文件和子文件夹for rename in listdir:rename = filepath + "//" + renameif os.path.isfile(rename):  # 是文件os.remove(rename)  # 删除文件elif os.path.isdir(rename):  # 是子文件duellist = os.listdir(rename)for f in duellist:  # 遍历该子文件夹file_path = os.path.join(rename, f)if os.path.isfile(file_path):  # 删除子文件夹下文件os.remove(file_path)elif os.path.isdir(file_path):  # 强制删除子文件夹下的子文件夹shutil.rmtree(file_path)

可以在用例文件执行开头增加一些 调用方法

如删除截图 和初始化 app环境 都是可以的  

3、pyautogui 

From:https://www.jb51.net/article/183926.htm

在使用 Python 做 安卓自动化脚本 时,两个库可以使用,一个为 PyUserInput 库,另一个为pyautogui 库。就本人而言,我更喜欢使用pyautogui库,该库功能多,使用便利。下面给大家介绍一下pyautogui库的使用方法。在cmd命令框中输入pip3 install pyautogui即可安装该库!

常用操作

我们在 pyautogui 库中常常使用的方法,如下:

import pyautogui# 调用在执行动作后暂停的秒数,只能在执行一些pyautogui动作后才能使用,建议用time.sleep
pyautogui.PAUSE = 1# 启用自动防故障功能,左上角的坐标为(0,0),将鼠标移到屏幕的左上角,来抛出failSafeException异常
pyautogui.FAILSAFE = True# 判断(x,y)是否在屏幕上
x, y = 122, 244
pyautogui.onScreen(x, y)  # 结果为truewidth, height = pyautogui.size()  # 屏幕的宽度和高度
print(width, height)

鼠标操作

我们在 pyautogui 库对于鼠标的使用方法大体如下:

import pyautoguicurrentMouseX, currentMouseY = pyautogui.position()  # 鼠标当前位置
print(currentMouseX, currentMouseY)# 控制鼠标移动,duration为持续时间
for i in range(2):pyautogui.moveTo(100, 100, duration=0.25)  # 移动到 (100,100)pyautogui.moveTo(200, 100, duration=0.25)pyautogui.moveTo(200, 200, duration=0.25)pyautogui.moveTo(100, 200, duration=0.25)for i in range(2):pyautogui.moveRel(50, 0, duration=0.25)  # 从当前位置右移100像素pyautogui.moveRel(0, 50, duration=0.25)  # 向下pyautogui.moveRel(-50, 0, duration=0.25)  # 向左pyautogui.moveRel(0, -50, duration=0.25)  # 向上# 按住鼠标左键,把鼠标拖拽到(100, 200)位置
pyautogui.dragTo(100, 200, button='left')
# 按住鼠标左键,用2秒钟把鼠标拖拽到(300, 400)位置
pyautogui.dragTo(300, 400, 2, button='left')
# 按住鼠标左键,用0.2秒钟把鼠标向上拖拽
pyautogui.dragRel(0, -60, duration=0.2)# pyautogui.click(
#     x=moveToX, y=moveToY, clicks=num_of_clicks, 
#     interval=secs_between_clicks, button='left'
# )
# 其中,button属性可以设置成left,middle和right。
pyautogui.click(10, 20, 2, 0.25, button='left')
pyautogui.click(x=100, y=200, duration=2)  # 先移动到(100, 200)再单击
pyautogui.click()  # 鼠标当前位置点击一下
pyautogui.doubleClick()  # 鼠标当前位置左击两下
pyautogui.doubleClick(x=100, y=150, button="left")  # 鼠标在(100,150)位置左击两下
pyautogui.tripleClick()  # 鼠标当前位置左击三下pyautogui.mouseDown()  # 鼠标左键按下再松开
pyautogui.mouseUp()
pyautogui.mouseDown(button='right')  # 按下鼠标右键
pyautogui.mouseUp(button='right', x=100, y=200)  # 移动到(100, 200)位置,然后松开鼠标右键# scroll函数控制鼠标滚轮的滚动,amount_to_scroll参数表示滚动的格数。正数则页面向上滚动,负数则向下滚动
# pyautogui.scroll(clicks=amount_to_scroll, x=moveToX, y=moveToY)
pyautogui.scroll(5, 20, 2)
pyautogui.scroll(10)  # 向上滚动10格
pyautogui.scroll(-10)  # 向下滚动10格
pyautogui.scroll(10, x=100, y=100)  # 移动到(100, 100)位置再向上滚动10格# 缓动/渐变函数可以改变光标移动过程的速度和方向。通常鼠标是匀速直线运动,这就是线性缓动/渐变函数。
# PyAutoGUI有30种缓动/渐变函数,可以通过pyautogui.ease*?查看。
# 开始很慢,不断加速
pyautogui.moveTo(100, 100, 2, pyautogui.easeInQuad)
# 开始很快,不断减速
pyautogui.moveTo(100, 100, 2, pyautogui.easeOutQuad)
# 开始和结束都快,中间比较慢
pyautogui.moveTo(100, 100, 2, pyautogui.easeInOutQuad)
# 一步一徘徊前进
pyautogui.moveTo(100, 100, 2, pyautogui.easeInBounce)
# 徘徊幅度更大,甚至超过起点和终点
pyautogui.moveTo(100, 100, 2, pyautogui.easeInElastic)

对于我们要获取鼠标在屏幕中的位置,我们可以采用如下代码:

# 案例获取鼠标的位置,方便复制我们定位的鼠标坐标点到代码中
import pyautogui
import time# 获取鼠标位置
def get_mouse_position():time.sleep(5)  # 准备时间print('开始获取鼠标位置')try:for i in range(10):# Get and print the mouse coordinates.x, y = pyautogui.position()positionStr = '鼠标坐标点(X,Y)为:{},{}'.format(str(x).rjust(4), str(y).rjust(4))pix = pyautogui.screenshot().getpixel((x, y))  # 获取鼠标所在屏幕点的RGB颜色positionStr += ' RGB:(' + str(pix[0]).rjust(3) + ',' + str(pix[1]).rjust(3) + ',' + str(pix[2]).rjust(3) + ')'print(positionStr)time.sleep(0.5)  # 停顿时间except:print('获取鼠标位置失败')if __name__ == "__main__":get_mouse_position()

也可以使用pyautogui库帮助文档的方法,不过本人认为使用上面的方法,更加便利。pyautogui库帮助文档的获取鼠标位置的方法如下:

import pyautoguiprint('Press Ctrl-C to quit.')
try:while True:# Get and print the mouse coordinates.x, y = pyautogui.position()positionStr = 'X:' + str(x).rjust(4) + ' Y:' + str(y).rjust(4)pix = pyautogui.screenshot().getpixel((x, y))  # 获取鼠标所在屏幕点的RGB颜色positionStr += ' RGB:(' + str(pix[0]).rjust(3) + ',' + \str(pix[1]).rjust(3) + ',' + str(pix[2]).rjust(3) + ')'print(positionStr, end='')  # end='' 替换了默认的换行# 连续退格键并刷新,删除之前打印的坐标,就像直接更新坐标效果print('\b' * len(positionStr), end='', flush=True)  
except KeyboardInterrupt:  # 处理 Ctrl-C 按键print('\nDone.')

键盘操作

我们在pyautogui库对于键盘的使用方法大体如下:

import pyautoguipyautogui.typewrite('Hello world!')  # 输入Hello world!字符串
pyautogui.typewrite('Hello world!', interval=0.25)  # 每次输入间隔0.25秒,输入Hello world!pyautogui.press('enter')  # 按下并松开(轻敲)回车键
pyautogui.press(['left', 'left', 'left', 'left'])  # 按下并松开(轻敲)四下左方向键
pyautogui.keyDown('shift')  # 按下`shift`键
pyautogui.keyUp('shift')  # 松开`shift`键pyautogui.keyDown('shift')
pyautogui.press('4')
pyautogui.keyUp('shift')  # 输出 $ 符号的按键pyautogui.hotkey('ctrl', 'v')  # 组合按键(Ctrl+V),粘贴功能,按下并松开'ctrl'和'v'按键# pyautogui.KEYBOARD_KEYS数组中就是press(),keyDown(),keyUp()和hotkey()函数可以输入的按键名称
pyautogui.KEYBOARD_KEYS = ['\t', '\n', '\r', ' ', '!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.','/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', ':', ';', '<', '=', '>', '?', '@','[', '\\', ']', '^', '_', '`', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l','m', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '{', '|', '}', '~','accept', 'add', 'alt', 'altleft', 'altright', 'apps', 'backspace', 'browserback','browserfavorites', 'browserforward', 'browserhome', 'browserrefresh', 'browsersearch','browserstop', 'capslock', 'clear', 'convert', 'ctrl', 'ctrlleft', 'ctrlright', 'decimal','del', 'delete', 'divide', 'down', 'end', 'enter', 'esc', 'escape', 'execute', 'f1', 'f10','f11', 'f12', 'f13', 'f14', 'f15', 'f16', 'f17', 'f18', 'f19', 'f2', 'f20', 'f21', 'f22','f23', 'f24', 'f3', 'f4', 'f5', 'f6', 'f7', 'f8', 'f9', 'final', 'fn', 'hanguel', 'hangul','hanja', 'help', 'home', 'insert', 'junja', 'kana', 'kanji', 'launchapp1', 'launchapp2','launchmail', 'launchmediaselect', 'left', 'modechange', 'multiply', 'nexttrack','nonconvert', 'num0', 'num1', 'num2', 'num3', 'num4', 'num5', 'num6', 'num7', 'num8', 'num9','numlock', 'pagedown', 'pageup', 'pause', 'pgdn', 'pgup', 'playpause', 'prevtrack', 'print','printscreen', 'prntscrn', 'prtsc', 'prtscr', 'return', 'right', 'scrolllock', 'select','separator', 'shift', 'shiftleft', 'shiftright', 'sleep', 'space', 'stop', 'subtract', 'tab','up', 'volumedown', 'volumemute', 'volumeup', 'win', 'winleft', 'winright', 'yen', 'command','option', 'optionleft', 'optionright'
]

弹窗操作

我们在 pyautogui 库对于弹出窗口的使用方法大体如下:

import pyautogui# 显示一个简单的带文字和OK按钮的消息弹窗。用户点击后返回button的文字。
pyautogui.alert(text='', title='', button='OK')
b = pyautogui.alert(text='要开始程序么?', title='请求框', button='OK')
print(b)  # 输出结果为OK# 显示一个简单的带文字、OK和Cancel按钮的消息弹窗,用户点击后返回被点击button的文字,支持自定义数字、文字的列表。
pyautogui.confirm(text='', title='', buttons=['OK', 'Cancel'])  # OK和Cancel按钮的消息弹窗
pyautogui.confirm(text='', title='', buttons=range(10))  # 10个按键0-9的消息弹窗
a = pyautogui.confirm(text='', title='', buttons=range(10))
print(a)  # 输出结果为你选的数字# 可以输入的消息弹窗,带OK和Cancel按钮。用户点击OK按钮返回输入的文字,点击Cancel按钮返回None。
pyautogui.prompt(text='', title='', default='')# 样式同prompt(),用于输入密码,消息用*表示。带OK和Cancel按钮。
# 用户点击OK按钮返回输入的文字,点击Cancel按钮返回None。
pyautogui.password(text='', title='', default='', mask='*')

图像操作

我们在pyautogui库对于图像的使用方法大体如下:

import pyautogui# 截全屏并设置保存图片的位置和名称
pyautogui.screenshot(r'C:\Users\ZDH\Desktop\PY\my_screenshot.png')  # 截全屏并设置保存图片的位置和名称
im = pyautogui.screenshot(r'C:\Users\ZDH\Desktop\PY\my_screenshot.png')  
print(im)  # 打印图片的属性# 不截全屏,截取区域图片。截取区域region参数为:左上角XY坐标值、宽度和高度
pyautogui.screenshot(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png', region=(0, 0, 300, 400)
)pix = pyautogui.screenshot().getpixel((220, 200))  # 获取坐标(220,200)所在屏幕点的RGB颜色
positionStr = ' RGB:(' + str(pix[0]).rjust(3) + ',' + \str(pix[1]).rjust(3) + ',' + str(pix[2]).rjust(3) + ')'
print(positionStr)  # 打印结果为RGB:( 60, 63, 65)
pix = pyautogui.pixel(220, 200)  # 获取坐标(220,200)所在屏幕点的RGB颜色与上面三行代码作用一样
positionStr = ' RGB:(' + str(pix[0]).rjust(3) + ',' + \str(pix[1]).rjust(3) + ',' + str(pix[2]).rjust(3) + ')'
print(positionStr)  # 打印结果为RGB:( 60, 63, 65)# 如果你只是要检验一下指定位置的像素值,可以用pixelMatchesColor(x,y,RGB)函数,把X、Y和RGB元组值穿入即可
# 如果所在屏幕中(x,y)点的实际RGB三色与函数中的RGB一样就会返回True,否则返回False
# tolerance参数可以指定红、绿、蓝3种颜色误差范围
pyautogui.pixelMatchesColor(100, 200, (255, 255, 255))
pyautogui.pixelMatchesColor(100, 200, (255, 255, 245), tolerance=10)# 获得文件图片在现在的屏幕上面的坐标,返回的是一个元组(top, left, width, height)
# 如果截图没找到,pyautogui.locateOnScreen()函数返回None
a = pyautogui.locateOnScreen(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png')
print(a)  # 打印结果为Box(left=0, top=0, width=300, height=400)
x, y = pyautogui.center(a)  # 获得文件图片在现在的屏幕上面的中心坐标
print(x, y)  # 打印结果为150 200# 这步与上面的四行代码作用一样
x, y = pyautogui.locateCenterOnScreen(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png')  
print(x, y)  # 打印结果为150 200# 匹配屏幕所有与目标图片的对象,可以用for循环和list()输出
pyautogui.locateAllOnScreen(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png')
for pos in pyautogui.locateAllOnScreen(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png'):print(pos)
# 打印结果为Box(left=0, top=0, width=300, height=400)
a = list(pyautogui.locateAllOnScreen(r'C:\Users\ZDH\Desktop\PY\region_screenshot.png'))
print(a)  # 打印结果为[Box(left=0, top=0, width=300, height=400)]

参考资料

PyAutoGUI帮助文档:https://blog.csdn.net/qq_34053552/article/details/79776671
pyautogui图形自动化,击败重复性办公任务:https://blog.csdn.net/qq_43017750/article/details/90575240


http://chatgpt.dhexx.cn/article/fwfWPiPt.shtml

相关文章

UIAutomation识别UI元素

MS UI Automation(Microsoft User Interface Automation&#xff1a;UIA)是随.net framework3.0一起发布的&#xff0c;虽然在如今这个几乎每天都有各种新名词、新技术出来的所谓的21世纪&#xff0c;它显得已经有些过时了。前些日子&#xff0c;正好一个项目&#xff0c;可以用…

uiautomation实现自动化

1.下载UI SPY 下载地址:https://download.csdn.net/download/yangzhichao_csdn/85389759 2.CMD指令导入uiautomation库 pip install uiautomation 3.打开计算器&#xff0c;然后打开UISpy 如图ControlType为”ControlType.Window” 那么捕获窗口就用:uiautomation.WindowCo…

Python uiautomation初探,测试Win10计算器

在网上找 Python 客户端自动化测试的库&#xff0c;一般有 pywinauto、pywin32、pyautogui、uiautomation。本文仅对 uiautomation 做简单的了解。 MS UI Automation 是 MSAA 技术的一个替代品&#xff1a;即让控件和应用程序具有更好的可达性&#xff08;accessible&#xff…

UIAutomation 自动化

Introduction UI Automation是Microsoft .NET 3.0框架下提供的一种用于自动化测试的技术&#xff0c;是在MSAA基础上建立的&#xff0c;MSAA就是Microsoft Active Accessibility。UI Automation在某些方面超过了MSAA&#xff0c;UI自动化提供了Windows Vista中&#xff0c;微软…

Python UI自动化 编程(一) UIAutomation

Python UI自动化 编程 第一章 Python UI自动化 编程入门之打开文件夹双击文件 文章目录 Python UI自动化 编程前言一、什么是Python UI自动化 编程二、环境说明1、Python环境&#xff1a;Python 3.82、IDE&#xff1a; Pycharm3、使用的库&#xff1a;UIAutomation 三、使用步…

【python】UI自动化-uiautomation

UI自动化-uiautomation 0- 前言1- inspect2- uiautomation3- 【实战】RustDesk软件自动 安装、指定服务器信息4- 参考文章 0- 前言 做应用程序自动点击的记录&#xff0c;暂不完整&#xff0c;仅供参考。参考多位大佬文章&#xff0c;链接在后面涉及工具 inspect【应用程序元素…

CAD 双击实体事件

CAD本身为我们提供的双击事件的设置。工具-工作空间-自定义...打开用户自定界面 窗体内找到双击动作。在双击动作下我们可以看到CAD自带的所有实体 例如我们在双击三维实体时自定义一个事件。那么我们就选中三维实体-快捷特性。在右侧特性里编辑宏内容。以下是系统彼带的宏$M$(…

深入探索透视投影变换(续)

-潘宏 -2009.4.14 -本人水平有限&#xff0c;疏忽错误在所难免&#xff0c;还请各位数学高手、编程高手不吝赐教 -email: popyynetease.com -B站专栏&#xff1a; https://b23.tv/oWsl6PD 在上一篇文章中我们讨论了透视投影变换的原理&#xff0c;分析了OpenGL所使用的透视…

凯文·凯利:AI将改变一切设计工作

每一项新技术诞生之初都会引发新一轮科技恐慌周期&#xff0c;近期大火的AI生成艺术更是如此。连线杂志创始主编、知名科技思想家凯文凯利&#xff08;Kevin Kelly&#xff09;在6个月重度使用之后认为&#xff0c;这次AI进展的确是一次令人震惊的突破。但是&#xff0c;它不会…

鼠标双击退出应用程序简单实现

文章目录 Android 简单模拟鼠标双击退出应用程序&#xff0c;利用Toast提示“再点一次退出”使用Toast鼠标单击提示信息鼠标双击实现退出系统 Android 简单模拟鼠标双击退出应用程序&#xff0c;利用Toast提示“再点一次退出” 使用Toast // 参数&#xff1a;当前上下文环境&…

如何用JavaScript完美地区分双击和单击事件

通过一个悬浮球交互功能的案例来阐述问题&#xff0c;以及解决办法。 实现效果 类似微信里的悬浮窗效果&#xff0c;苹果手机的悬浮球功能效果 1.可以点击拖动&#xff0c;然后吸附在窗口边缘2.点击悬浮球&#xff0c;可以跳转界面&#xff0c;或者更改悬浮球的形态准备 1.移…

单机显示、双击隐藏;事件绑定、单击div、双击div、删除事件;元素显示、隐藏、交替; 向上收缩、向下展开、交替;淡入淡出

单机显示、双击隐藏 <style>div {width: 500px;height: 200px;background-color: green;display: none;} </style> <body><button id"btn">单击显示&#xff0c;双击隐藏</button><br><br><div> </div&…

干货分享 | UE游戏鼠标双击判定

UE虚幻引擎对于游戏开发者来说都不陌生&#xff0c;市面上有47%主机游戏使用虚幻引擎开发游戏。作为是一款游戏的核心动力&#xff0c;它的功能十分完善&#xff0c;囊括了场景制作、灯光渲染、动作镜头、粒子特效、材质蓝图等。本文介绍了虚幻引擎游戏开发过程中游戏鼠标双击判…

鼠标单击变双击问题

解决此问题可以从硬件和软件两方面思考角度入手:我们先把鼠标插在别人的机器上使用,如果没发现问题可能是软件问题,若发现同样的问题则可能是硬件方面的问题。 软件方面:(1)病毒导致将杀毒软件病毒库更新至最新版,全盘扫描。 (2)鼠标属性设置不当我们打开控制面板-&…

鼠标双击事件

随时随地阅读更多技术实战干货&#xff0c;获取项目源码、学习资料&#xff0c;请关注源代码社区公众号(ydmsq666) java中没有给出鼠标双击事件&#xff0c;虽然可以通过事件源e.getClickCount()2来判断鼠标点击次数&#xff0c;但是执行双击事件的同时也执行了单击事件&#x…

关于双击与单击事件冲突解决方案

有时候会要需求要求&#xff0c;比如附件&#xff0c;单击查看详情&#xff0c;双击下载文件时遇到的双击单击事件同时绑定一个节点。 比如单击click&#xff0c;dlbclick同时绑定时&#xff0c;双击会同时触发&#xff0c;而且click会触发两次。单用click来处理双击单击同时存…

TRUE PARTNER迎来戴维斯双击,资产规模业绩双增长

配图来自Canva可画 2020年可谓是黑天鹅乱舞的一年&#xff0c;新冠疫情肆虐全球&#xff1b;原油危机引发的资本市场动荡&#xff1b;地缘政治冲突以及美国大选&#xff0c;市场处于时不时来一波的上蹿下跳的状态当中。 在资本市场波动加剧的大环境中&#xff0c;有这样一家奇…

慧择业务布局成效明显,戴维斯双击可期

“没有一个冬天不会过去&#xff0c;没有一个春天不会到来”。 过去的一年&#xff0c;美股市场波折不断&#xff0c;尤其是2020年3月份的4次熔断&#xff0c;让股神巴菲特都惊呼“活久见”。 过去的一年&#xff0c;美股市场惊喜不断&#xff0c;道琼斯指数更是在2020年11月创…

流动性持续改善,佳源国际迎来“戴维斯双击”?

随着上半年密集的救市政策出台&#xff0c;房地产行业迎来触底回暖。 5月&#xff0c;央行以不低于市场报价利率20个基点调整首套房贷款利率下限&#xff0c;这也让当前金融环境在近几年处于较为宽松的阶段。 据克而瑞研究中心观点&#xff0c;因冲刺年中业绩&#xff0c;房企…

湖人詹姆斯 戴维斯 拉塞尔三人合体就赢!

湖人主力詹姆斯&#xff08;LeBron James&#xff09;球星成为NBA新历史得分王后&#xff0c;连3战因伤缺席&#xff0c;今天主场对抗鹈鹕终于回归&#xff0c;和戴维斯&#xff08;Anthony Davis&#xff09;、拉塞尔&#xff08;DAngelo Russell&#xff09;三人连线&#xf…