XPath学习

一、基本语法

1、以 / 斜线开始,该路径表示到一个元素下的绝对路径

2、如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)

3、星号 * 表示选择所有由星号之前的路径所定位的元素(/AAA/BBB/DDD/* 选择AAA/BBB/DDD下的所有元素;/*/*/*/BBB选择第四层级为BBB的所有元素)

4、[]和last()

方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素.如(/AAA/BBB[0]和/AAA/BBB[last()])

5、属性(有无属性)

//@id  选择所有属性为id的元素     //BBB[@id]    选择有id属性的BBB元素   //BBB[@name]   选择有name属性的BBB元素      //BBB[@*]  选择有任意属性的BBB元素

//BBB[not(@*)]   选择没有属性的BBB元素

6、属性2(带值的属性)

normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格

   //BBB[@id=‘b1‘] 选择含有属性id且其值为‘b1‘的BBB元素     //BBB[@name=‘bbb‘]  选择含有属性name且其值为‘bbb‘的BBB元素  //BBB[normalize-space(@name)=‘bbb‘] 选择含有属

性name且其值(在用normalize-space函数去掉前后空格后)为‘bbb‘的BBB元素

7、count()函数

//*[count(BBB)=2] 选择含有2个BBB子元素的元素   //*[count(*)=2]选择含有2个子元素的元素

8、name()函数

name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true.

//*[name()=‘BBB‘] 选择所有名称为BBB的元素(这里等价于//BBB)     //*[starts-with(name(),‘B‘)]选择所有名称以"B"起始的元素     //*[contains(name(),‘C‘)]选择所有名称包含"C"的元素

9、string-length函数

string-length函数返回字符串的字符数

//*[string-length(name()) = 3]  选择名字长度为3的元素   //*[string-length(name()) < 3] 选择名字长度小于3的元素

10、分隔符 |

多个路径可以用分隔符 | 合并在一起

//CCC | //BBB 选择所有的CCC和BBB元素

11、descendant (后代)轴

descendant (后代)轴包含上下文节点的后代,一个后代是指子节点或者子节点的子节点等等, 因此descendant轴不会包含属性和命名空间节点.

/descendant::*   选择文档根元素的所有后代.即所有的元素被选择   /AAA/BBB/descendant::*    选择/AAA/BBB的所有后代元素   //CCC/descendant::DDD 选择所有以CCC为祖先元素的DDD元素

12、parent轴

parent轴(axis)包含上下文节点的父节点, 如果有父节点的话

//DDD/parent:: *选择DDD元素的所有父节点

13、ancestor轴

选择祖先节点

/AAA/BBB/DDD/CCC/EEE/ancestor::*  选择EEE的所有根节点   //FFF/ancestor::*  选择FFF元素的祖先节点

14、following-sibling轴

following-sibling轴(axis)包含上下文节点之后的所有兄弟节点

/AAA/BBB/following-sibling::*  选择与BBB同级后边的兄弟节点

15、preceding-sibling 轴

preceding-sibling 轴(axis)包含上下文节点之前的所有兄弟节点

与14刚好相反,一个是之前,一个是之后

16、following轴

following轴(axis)包含同一文档中按文档顺序位于上下文节点之后的所有节点, 除了祖先节点,属性节点和命名空间节点

其后的所有节点,包含不同级别的等只要是在节点之后的所有节点

17、descendant-or-self 轴

descendant-or-self 轴(axis)包含上下文节点本身和该节点的后代节点

18、ancestor-or-self 轴(axis)

ancestor-or-self 轴(axis)包含上下文节点本身和该节点的祖先节点

时间: 2024-08-30 08:23:35

XPath学习的相关文章

HtmlAgilityPackage XPath学习

原文:HtmlAgilityPackage XPath学习 最近的开发中要用到htmlAgilityPackage, 所以记录一下XPath相关知识! XPath 简介 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历.XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上.因此,对 XPath 的理解是很多高级 XML 应用的基础. 其实对些我们并不陌生,最与XP

XML Xpath学习

Xpath是一门在xml文档中查找信息的语言. Xpath可用来在xml文档中对元素和属性进行遍历. <1>路径表达式1: 斜杠(/)作为路径内部的分隔符 同一个路径有绝对路径和相对路径两种写法 绝对路径:必须用"/"起首,后面紧跟根节点.如/step/setp 相对路径:不用"/"起首.如step/step "."表示当前节点 ".."表示当前路径的父节点 <2>路径表达式2: nodename(节点

XPath学习:轴(3)——descendant

转自:http://www.cnblogs.com/zhaozhan/archive/2009/09/10/1563723.html 感谢无风 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_

XPath学习:parent,child

XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_chi/examples.html  里面有很不错的例子,下面的例子中红色字体表示使用对应语法获取的元素(或属性). XPath轴(XPath

xpath 学习

[java] view plaincopy import java.io.IOException; import javax.xml.parsers.*; import javax.xml.xpath.*; import org.w3c.dom.*; import org.xml.sax.SAXException; public class XpathTest { public static void main(String[] args) throws ParserConfigurationE

scrapy爬虫必需品--------xpath学习

XPath 路径表达式 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集.这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. 节点 在 XPath 中,有七种类型的节点:元素.属性.文本.命名空间.处理指令.注释以及文档(根)节点.XML 文档是被作为节点树来对待的.树的根被称为文档节点或者根节点. 请看下面这个 XML 文档: <?xml version="1.0" encodin

python+selenium元素定位之XPath学习01

参考文档1:https://www.w3school.com.cn/xpath/xpath_syntax.asp 参考文档2:https://www.runoob.com/xpath/xpath-tutorial.html XML 实例文档 我们将在下面的例子中使用这个 XML 文档: <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title

python+selenium元素定位之XPath学习02

XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. XML 实例文档 我们将在下面的例子中使用这个 XML 文档. 实例 <?xml version="1.0" encoding="UTF-8"?> <bookstore> <book> <title lang="eng">Harry Potter&l

xpath学习笔记

符号. //表示当前节点.. //父节点/ //根目录// //节点下的任意位置 高级应用:"ul//em" 表示ul节点下任意位置的em@ //含某属性的节点 //@title 那么 <li class='a' title='1'>满足 和其他组合在一起就报错| //a|b 选择a和b元素* //所有节点node() //所有节点 还包含里面的值 比如<i>1</i> 1也是一个对象元素 这是和*的不同之处text() //所有文字节点 node(

【Xpath学习】xpath都不会,说什么你做网站自动化测试的?

嗯我确实不太会.感觉我写的随笔很渣,不一定对,大家不要被我误导了,最好不要看.我也尽量保证写出来都是对的. 首先这俩给我搞晕了 1. // 不管层级:  相对路径 2. /  care 层级: 表示到一个元素的绝对路径 3. //DDD/BBB: 混合的咋解释? 所有的DDD元素下的BBB元素,不管在哪里 4. *号表示选则星号之前的路径所定位的元素 //*: 选中所有元素 /*/*/*/BBB: 这种,有仨个祖先元素的BBB元素 5. [数字]  : 你要选该路径限定的元素中的第几个? 用[n