selenium+xpath 文本信息定位

selenium中根据父子、兄弟、相邻节点定位的方法,很多人在实际应用中会遇到想定位的节点无法直接定位,需要通过附近节点来相对定位的问题,但从父节点定位子节点容易,从子节点定位父节点、定位一个节点的哥哥节点。

第一种方法:通过绝对路径做定位(相信大家不会使用这种方式)

By.xpath("html/body/div/form/input")
By.xpath("//input")

第三种方法:通过元素索引定位

By.xpath("//input[4]")

第四种方法:使用xpath属性定位(结合第2、第3中方法可以使用)

By.xpath("//input[@id=‘kw1‘]")
By.xpath("//input[@type=‘name‘ and @name=‘kw1‘]")

第五种方法:使用部分属性值匹配(最强大的方法)

By.xpath("//input[start-with(@id,‘nice‘)
By.xpath("//input[ends-with(@id,‘很漂亮‘)
By.xpath("//input[contains(@id,‘那么美‘)]")

1. 由父节点定位子节点

最简单的肯定就是由父节点定位子节点了,我们有很多方法可以定位,下面上个例子:

对以下代码:

<html>
<body>
<div id="A">
    <!--父节点定位子节点-->
    <div id="B">
        <div>parent to child</div>
    </div>
</div>
</body>
</html>
  • 想要根据 B节点 定位无id的子节点,代码示例如下:
# -*- coding: utf-8 -*-
from selenium import webdriver

driver = webdriver.Firefox()
driver.get(‘D:\\py\\AutoTestFramework\\src\\others\\test.html‘)

# 1.串联寻找
print driver.find_element_by_id(‘B‘).find_element_by_tag_name(‘div‘).text

# 2.xpath父子关系寻找
print driver.find_element_by_xpath("//div[@id=‘B‘]/div").text

# 3.css selector父子关系寻找
print driver.find_element_by_css_selector(‘div#B>div‘).text

# 4.css selector nth-child
print driver.find_element_by_css_selector(‘div#B div:nth-child(1)‘).text

# 5.css selector nth-of-type
print driver.find_element_by_css_selector(‘div#B div:nth-of-type(1)‘).text

# 6.xpath轴 child
print driver.find_element_by_xpath("//div[@id=‘B‘]/child::div").text

driver.quit()
  • 结果:
parent to child
parent to child
parent to child
parent to child
parent to child
parent to child
  • 第1到第3都是我们熟悉的方法,便不再多言。第4种方法用到了css选择器:nth-child(n),该选择器返回第n个节点,该节点为div标签;第5种方法用到了另一个css选择器: nth-of-type(n),该选择器返回第n个div标签,注意与上一个选择器的区别;第6种方法用到了xpath轴 child,这个是xpath默认的轴,可以忽略不写,其实质是跟方法2一样的。

当然,css中还有一些选择器是可以选择父子关系的如last-childnth-last-child等,感兴趣可以自行百度,有机会博主会讲讲css selector。

2. 由子节点定位父节点

由子节点想要定位到父节点就有点难度了,对以下代码:

<html>
<body>
<div id="A">
    <!--子节点定位父节点-->
    <div>
        <div>child to parent
            <div>
                <div id="C"></div>
            </div>
        </div>
    </div>
</div>
</body>
</html>
  • 我们想要由 C节点 定位其两层父节点的div,示例代码如下:
# -*- coding: utf-8 -*-
from selenium import webdriver

driver = webdriver.Firefox()
driver.get(‘D:\\py\\AutoTestFramework\\src\\others\\test.html‘)

# 1.xpath: `.`代表当前节点; ‘..‘代表父节点
print driver.find_element_by_xpath("//div[@id=‘C‘]/../..").text

# 2.xpath轴 parent
print driver.find_element_by_xpath("//div[@id=‘C‘]/parent::*/parent::div").text

driver.quit()
  • 结果:
child to parent
child to parent
  • 这里我们有两种办法,第1种是 .. 的形式,就像我们知道的,. 表示当前节点,.. 表示父节点;第2种办法跟上面一样,是xpath轴中的一个:parent,取当前节点的父节点。这里也是css selector的一个痛点,因为css的设计不允许有能够获取父节点的办法(至少目前没有)

3. 由弟弟节点定位哥哥节点

这是第3、第4种情况,我们这里要定位的是兄弟节点了。如以下源码:

<html>
<body>
<div>
    <!--下面两个节点用于兄弟节点定位-->
    <div>brother 1</div>
    <div id="D"></div>
    <div>brother 2</div>
</div>
</body>
</html>
  • 怎么通过 D节点 定位其哥哥节点呢?看代码示例:
# -*- coding: utf-8 -*-
from selenium import webdriver

driver = webdriver.Firefox()
driver.get(‘D:\\Code\\py\\AutoTestFramework\\src\\others\\test.html‘)

# 1.xpath,通过父节点获取其哥哥节点
print driver.find_element_by_xpath("//div[@id=‘D‘]/../div[1]").text

# 2.xpath轴 preceding-sibling
print driver.find_element_by_xpath("//div[@id=‘D‘]/preceding-sibling::div[1]").text

driver.quit()
  • 结果
brother 1
brother 1
  • 这里博主也列举了两种方法,一种是通过该节点的父节点来获得哥哥节点,另外一种比较优雅,是通过 xpath轴:preceding-sibling,其能够获取当前节点的所有同级哥哥节点,注意括号里的标号,1 代表着离当前节点最近的一个哥哥节点,数字越大表示离当前节点越远,当然,xpath轴:preceding也可以,但是使用起来比较复杂,它获取到的是该节点之前的所有非祖先节点(这里不太好解释,改天专门写篇博文讲解下所有的轴)

4. 由哥哥节点定位弟弟节点

源码与 3 一致,要想通过 D节点 定位其弟弟节点,看代码示例:

# -*- coding: utf-8 -*-
from selenium import webdriver

driver = webdriver.Firefox()
driver.get(‘D:\\Code\\py\\AutoTestFramework\\src\\others\\test.html‘)

# 1.xpath,通过父节点获取其弟弟节点
print driver.find_element_by_xpath("//div[@id=‘D‘]/../div[3]").text

# 2.xpath轴 following-sibling
print driver.find_element_by_xpath("//div[@id=‘D‘]/following-sibling::div[1]").text

# 3.xpath轴 following
print driver.find_element_by_xpath("//div[@id=‘D‘]/following::*").text

# 4.css selector +
print driver.find_element_by_css_selector(‘div#D + div‘).text

# 5.css selector ~
print driver.find_element_by_css_selector(‘div#D ~ div‘).text

driver.quit()
  • 结果:
brother 2
brother 2
brother 2
brother 2
brother 2
  • 博主分享了五种方法定位其弟弟节点,上面三种是用xpath,第一种很好理解,第二种用到了xpath轴:following-sibling,跟preceding-sibling类似,它的作用是获取当前节点的所有同级弟弟节点,同样,1代表离当前节点最近的一个弟弟节点,数字越大表示离当前节点越远;第三种用到了xpath轴:following,获取到该节点之后所有节点,除了祖先节点(跟preceding方向相反,但因为往下顺序容易读,不容易出错,所以也是可以用来获取弟弟节点的,但也不建议这么使用);第四、第五种,我们用到了css selector,+ 和 ~ 的区别是: + 表示紧跟在当前节点之后的div节点,~ 表示当前节点之后的div节点,如果用find_elements,则可获取到一组div节点。

XPath、CSS定位速查表

xpath css cheat sheet

HTML版如下:

描述 Xpath CSS Path
直接子元素 //div/a div > a
子元素或后代元素 //div//a div a
以id定位 //div[@id=’idValue’]//a div#idValue a
以class定位 //div[@class=’classValue’]//a div.classValue a
同级弟弟元素 //ul/li[@class=’first’]/following-sibling::li ul>li.first + li
属性 //form/input[@name=’username’] form input[name=’username’]
多个属性 //input[@name=’continue’ and @type=‘button’] input[name=’continue’][type=’button’]
第4个子元素 //ul[@id=’list’]/li[4] ul#list li:nth-child(4)
第1个子元素 //ul[@id=’list’]/li[1] ul#list li:first-child
最后1个子元素 //ul[@id=’list’]/li[last()] ul#list li:last-child
属性包含某字段 //div[contains(@title,’Title’)] div[title*=”Title”]
属性以某字段开头 //input[starts-with(@name,’user’)] input[name^=”user”]
属性以某字段结尾 //input[ends-with(@name,’name’)] input[name$=”name”]
text中包含某字段 //div[contains(text(), ‘text‘)] 无法定位
元素有某属性 //div[@title] div[title]
父节点 //div/.. 无法定位
同级哥哥节点 //li/preceding-sibling::div[1] 无法定位

原文地址:https://www.cnblogs.com/klb561/p/9307978.html

时间: 2024-11-09 05:07:28

selenium+xpath 文本信息定位的相关文章

selenium通过文本内容定位元素(div,td,span等)

# 通过文本内容精准定位元素.可能由于页面内容有空格,经常定位不到元素 driver.find_element_by_xpath('//div[text()="活动服务"]') # 若要定位其它标签元素(如:td,span等),只需要替换div即可 # 通过文本内容模糊定位元素 driver.find_element_by_xpath('//div[contains(text(),"活动服务")]') 原文地址:https://www.cnblogs.com/tes

Selenium自动化中DOM,XPATH,CSS定位Web页面对象的优劣性分析

加速IE浏览器自动化执行效率:Selenium自动化中DOM,XPATH,CSS定位Web页面对象的优劣性分析 1.技术背景       在Web应用中,用户通过键盘在输入框中输入值和鼠标点击按钮,链接等.比如在用户名输入框和密码输入框输入正确的用户名和密码,然后点击登录按钮进行登录.在Selenium自动化中,Selenium提供多种API来对HTML元素进行操作,对于每个HTML元素,需要一个可以标识它的标识符,在Selenium中称之为定位器,Selenium支持多种不同类型的定位器,有标

selenium获取文本

# 标题list_title = driver.find_elements_by_xpath('//*[@id="share-content"]/div/div[1]/ul/li/h3/a')print(list_title)# 用selenium + xpath 抓取网页数据,上述代码返回的是列表类型,打印出来是:[<selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb

web中的CSS、Xpath等路径定位方法学习

今天不到八点就到公司了,来的比较早,趁着有点时间,总结下web中的CSS.Xpath等路径定位定位的方式吧! 简单的介绍下xpath和css的定位 理论知识就不罗列了 还是利用博客园的首页.直接附上代码: 这个是xpath 1 #!/usr/bin/env python 2 # -*- coding: utf_8 -*- 3 4 from learn_webdriver import Webdriver 5 from selenium import webdriver 6 from seleni

selenium 操作文本框(textarea输入)

selenium 对文本框的输入操作一般有两种形式,传统的是直接通过定位元素通过sendKeys()方法直接在文本框中输入信息.但有时候我们可以通过id 的方式将其进行定位,但却不能通过sendKeys()向文本框中输入文本信息. 这种情况下,也需要借助JavaScript 代码完成输入. HTML代码 <textarea id="id" style="width: 98%" cols="50" rows="5" cla

selenium webdriver 表格的定位方法练习

selenium webdriver 表格的定位方法 html 数据准备 <html> <body> <div id="div1"> <input name="divl1input"></input> <a href="http://www.sogou.com/">搜狗搜索</a> <img alt="div1-img1 "src=&qu

selenium+Python之select定位

一.二次定位 基本思路,先定位select框,再定位select里的选项 二.通过Select模块定位 导入:from selenium.webdriver.support.select import Select 定位方法: select_by_index()  :通过索引定位select_by_value()  :通过value值定位select_by_visible_text() :通过文本值定位deselect_all()          :取消所有选项deselect_by_inde

Jquery获取select选中的option的文本信息

注意:下面用的$(this)代表当前选中的select框 第一种: $(this).children("option:selected").text(); 第二种: $(this).children("option:selected").html(); Jquery获取select选中的option的文本信息,布布扣,bubuko.com

【Selenium WebDriver】元素定位函数 FindElement

定位Web页面上的元素,用FindElement函数,它可以根据元素的不同属性来快速定位.具体的属性如下: 例子: HTML页面文件: 1 <html xmlns="http://www.w3.org/1999/xhtml" lang="en-us"> 2 <head> 3 <body> 4 <form name="loginForm"> 5 <label for="username