【python爬虫】selenium的三种等待

一、 强制等待

  第一种也是最简单粗暴的一种办法就是强制等待sleep(xx),强制让闪电侠等xx时间,不管凹凸曼能不能跟上速度,还是已经提前到了,都必须等xx时间。

1 from selenium import webdriver
2 from time import sleep
3 driver = webdriver.Firefox()
4 driver.get(‘https://huilansame.github.io‘)
5 sleep(3) # 强制等待3秒再执行下一步
6 print driver.current_url
7 driver.quit()

  这种叫强制等待,不管你浏览器是否加载完了,程序都得等待3秒,3秒一到,继续执行下面的代码,作为调试很有用,有时候也可以在代码里这样等待,不过不建议总用这种等待方式,太死板,严重影响程序执行速度。

二、隐性等待

1 from selenium import webdriver
2 driver = webdriver.Firefox()
3 driver.implicitly_wait(30) # 隐性等待,最长等30秒
4 driver.get(‘https://huilansame.github.io‘)
5 print driver.current_url
6 driver.quit()

  隐形等待是设置了一个最长等待时间,如果在规定时间内网页加载完成,则执行下一步,否则一直等到时间截止,然后执行下一步。

  注意这里有一个弊端,那就是程序会一直等待整个页面加载完成,也就是一般情况下你看到浏览器标签栏那个小圈不再转,才会执行下一步,但有时候页面想要的元素早就在加载完成了,但是因为个别js之类的东西特别慢,我仍得等到页面全部完成才能执行下一步,我想等我要的元素出来之后就下一步怎么办?有办法,这就要看selenium提供的另一种等待方式——显性等待wait了。

三、 显性等待

  第三种办法就是显性等待,WebDriverWait,配合该类的until()和until_not()方法,就能够根据判断条件而进行灵活地等待了。它主要的意思就是:程序每隔xx秒看一眼,如果条件成立了,则执行下一步,否则继续等待,直到超过设置的最长时间,然后抛出TimeoutException。

from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
driver = webdriver.Firefox()
 1 # 隐性等待和显性等待可以同时用,但要注意:等待的最长时间取两者之中的大者
 2 driver.implicitly_wait(10)
 3
 4 driver.get(‘https://huilansame.github.io‘)
 5 locator = (By.LINK_TEXT, ‘CSDN‘)
 6 try:
 7     wait = WebDriverWait(driver, 20, 0.5)
 8     wait.until(EC.presence_of_element_located(locator))
 9     print(driver.find_element_by_link_text(‘CSDN‘).get_attribute(‘href‘))
10 finally:
11 driver.close()

expected_conditions模块

  expected_conditions是selenium的一个模块,其中包含一系列可用于判断的条件。

1 EC.title_is
2 EC.title_contains
3 # 这两个条件类验证title,验证传入的参数title是否等于或在driver.title中 
1 EC.presence_of_element_located((By.CSS_SELECTOR,‘.ui-page > wrap‘))
2 EC.presence_of_all_elements_located((By.CSS_SELECTOR,‘.ui-page‘))
3 # 这两个条件验证元素是否出现,传入的参数都是元组类型的locator,如(By.ID, ‘kw‘)
4 # 一个只要一个符合条件的元素加载出来就通过;
5 # 另一个必须所有符合条件的元素都加载出来才行
1 EC.visibility_of_element_located
2 EC.invisibility_of_element_located
3 EC.visibility_of
4 # 这三个条件验证元素是否可见
5 # 前两个传入参数是元组类型的locator,第三个传入WebElement
6 # 第一个和第三个其实质是一样的
1 EC.text_to_be_present_in_element
2 EC.text_to_be_present_in_element_value
3 # 这两个判断某段文本是否出现在某元素中
4 # 一个判断元素的text,一个判断元素的value属性
1 EC.frame_to_be_available_and_switch_to_it
2 # 这个条件判断frame是否可切入,
3 # 可传入locator元组或者直接传入定位方式:id、name、index或WebElement 
 1 # 这个条件判断是否有alert出现
 2 EC.alert_is_present
 3 #这个条件判断元素是否可点击,传入locator
 4 EC.element_to_be_clickable
 5 # 这四个条件判断元素是否被选中,
 6 第一个条件传入WebElement对象,第二个传入locator元组
 7 # 第三个传入WebElement对象以及状态,相等返回True,否则返回False
 8 # 第四个传入locator以及状态,相等返回True,否则返回False
 9 EC.element_to_be_selected
10 EC.element_located_to_be_selected
11 EC.element_selection_state_to_be
12 EC.element_located_selection_state_to_be
13 # 最后一个条件判断一个元素是否仍在页面中,传入WebElement对象,可以判断页面是否刷新
14 EC.staleness_of

原文地址:https://www.cnblogs.com/Tree0108/p/12089510.html

时间: 2024-08-29 02:01:36

【python爬虫】selenium的三种等待的相关文章

Selenium中三种等待的使用方式

在UI自动化测试中,必然会遇到环境不稳定,网络慢的情况,这时如果你不做任何处理的话,代码会由于没有找到元素,而报错.这时我们就要用到wait(等待),而在Selenium中,我们可以用到一共三种等待,每一种等待都有自己的优点或缺点,如何选择最优的等待方式呢.来看下这三种等待方式吧.选择合理的等待方式,可以规避网络延迟,代码不稳定问题 time(固定等待) 在开发自动化框架过程中,最忌讳使用Python自带模块的time的sleep方法进行等待,虽然可以自定义等待时间,但当网络条件良好时,依旧按照

【转】selenium webdriver三种等待方法

原文:https://www.cnblogs.com/lgh344902118/p/6015593.html webdriver三种等待方法 1.使用WebDriverWait from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait # available since 2.4.0 from s

selenium的三种等待方式

一.强制等待: time.sleep(3)---->强制等待3秒 二.隐式等待: driver.implicitly_wait(20) 含义:设置的这个20秒表示最大等待时长,它等待到什么情况结束呢?--->它就相当于我们在浏览器中,加载一个页面,看到页面不在转圈圈,全部加载完成之后,才算等待结束. 全部加载完成在浏览器其实包含以下内容: 1.页面的html从服务器返回. 2.页面的所有静态资源,js,css,img,广告,全部从服务器获取,在加载到页面中. 隐式等待的弊端: 一般我们在写程序

05-Selenium的三种等待

目录 Selenium的三种等待 一.强制等待 二.隐形等待 三.显性等待 3.1 WebDriverWait与expected_conditions结合使用 3.2 自行定义等待器 Selenium的三种等待 当执行python的selenium代码时,如果需要定位一个元素或者点击一个元素,需要考虑到网速等多方面原因,导致页面加载速度慢,元素还未加载出来,这样就会导致找不到对应元素,从而报错的问题,所以要设置等待条件,等待元素加载出来后才执行相应的代码. 其中,selenium中有三种等待方式

selenium中的三种等待方式(显示等待WebDriverWait()、隐式等待implicitly()、强制等待sleep())---基于python

我们在实际使用selenium或者appium时,等待下个等待定位的元素出现,特别是web端加载的过程,都需要用到等待,而等待方式的设置是保证脚本稳定有效运行的一个非常重要的手段,在selenium中(appium通用)常用的等待分为显示等待WebDriverWait().隐式等待implicitly_wait().强制等待sleep()三种,下面我们就分别介绍一下这三种等待的区别 在前面的博文中简单介绍了<强制等待和隐士等待的区别和理解>,本文再详细的结合案例进行理解. sleep(): 强

Selenium彩蛋篇-三种等待的使用方式

转: http://www.imdsx.cn/index.php/2017/07/27/ec/ 在UI自动化测试中,必然会遇到环境不稳定,网络慢的情况,这时如果你不做任何处理的话,代码会由于没有找到元素,而报错.这时我们就要用到wait(等待),而在Selenium中,我们可以用到一共三种等待,没一种等待都有自己的优点或缺点,如果选择最优的等待方式呢.来看下这三种等待方式吧. time(固定等待) 在开发自动化框架过程中,最忌讳使用Python自带模块的time的sleep方法进行等待,虽然可以

Selenium学习之==&gt;三种等待方式

在UI自动化测试中,必然会遇到环境不稳定,网络慢的情况,这时如果你不做任何处理的话,代码会由于没有找到元素,而报错.这时我们就要用到wait(等待),而在Selenium中,我们可以用到一共三种等待,每一种等待都有自己的优点或缺点,我们需要选择最优的等待方式.下面我们来介绍三种等待方式. 第一种:固定等待(time.sleep()) 在开发自动化框架过程中,最忌讳使用Python自带模块的time的sleep方法进行等待,虽然可以自定义等待时间,但当网络条件良好时,依旧按照预设定的时间继续等待,

[Python爬虫] Selenium爬取新浪微博移动端热点话题及评论 (下)

这篇文章主要讲述了使用python+selenium爬取新浪微博的热点话题和评论信息.其中使用该爬虫的缺点是效率极低,傻瓜式的爬虫,不能并行执行等,但是它的优点是采用分析DOM树结构分析网页源码并进行信息爬取,同时它可以通过浏览器进行爬取中间过程的演示及验证码的输入.这篇文章对爬虫的详细过程就不再论述了,主要是提供可运行的代码和运行截图即可.希望文章对你有所帮助吧~ 参考文章 [python爬虫] Selenium爬取新浪微博内容及用户信息 [Python爬虫] Selenium爬取新浪微博客户

Selenium-----wait的三种等待

在UI自动化测试中,必然会遇到环境不稳定,网络慢的情况,这时如果你不做任何处理的话,代码会由于没有找到元素,而报错.这时我们就要用到wait(等待),而在Selenium中,我们可以用到一共三种等待,没一种等待都有自己的优点或缺点,如果选择最优的等待方式呢.来看下这三种等待方式吧. time(固定等待) 在开发自动化框架过程中,最忌讳使用Python自带模块的time的sleep方法进行等待,虽然可以自定义等待时间,但当网络条件良好时,依旧按照预设定的时间继续等待,导致整个项目的自动化时间无限延