XPath 轴

XML 实例文档

我们将在下面的例子中使用此 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>

<book>
  <title lang="eng">Learning XML</title>
  <price>39.95</price>
</book>

</bookstore>

XPath 轴

轴可定义相对于当前节点的节点集。

轴名称 结果
ancestor 选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
attribute 选取当前节点的所有属性。
child 选取当前节点的所有子元素。
descendant 选取当前节点的所有后代元素(子、孙等)。
descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following 选取文档中当前节点的结束标签之后的所有节点。
namespace 选取当前节点的所有命名空间节点。
parent 选取当前节点的父节点。
preceding 选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling 选取当前节点之前的所有同级节点。
self 选取当前节点。

位置路径表达式

位置路径可以是绝对的,也可以是相对的。

绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

绝对位置路径:

/step/step/...

相对位置路径:

step/step/...

每个步均根据当前节点集之中的节点来进行计算。

步(step)包括:

轴(axis)
定义所选节点与当前节点之间的树关系
节点测试(node-test)
识别某个轴内部的节点
零个或者更多谓语(predicate)
更深入地提炼所选的节点集

步的语法:

轴名称::节点测试[谓语]

实例

例子 结果
child::book 选取所有属于当前节点的子元素的 book 节点。
attribute::lang 选取当前节点的 lang 属性。
child::* 选取当前节点的所有子元素。
attribute::* 选取当前节点的所有属性。
child::text() 选取当前节点的所有文本子节点。
child::node() 选取当前节点的所有子节点。
descendant::book 选取当前节点的所有 book 后代。
ancestor::book 选择当前节点的所有 book 先辈。
ancestor-or-self::book 选取当前节点的所有 book 先辈以及当前节点(如果此节点是 book 节点)
child::*/child::price 选取当前节点的所有 price 孙节点。
时间: 2024-12-20 20:36:25

XPath 轴的相关文章

Xpath轴与步长应用:取某节点下所有子孙节点里的文本内容

最近遇到个需求,需要爬一些数据使用,写好了爬虫后爬到了一段HTML,然后用lxml解析,接下来就是定位到具体节点提取内容.遇到了一个问题,想要提取的内容在一个class名为full-content的<div>中,文本内容有可能就在div中,可有可能在子孙节点中,那怎么全部提取呢?查了一下Xpath有轴与步长的用法, 详细用法参考:http://www.w3school.com.cn/xpath/xpath_axes.asp 轴名称 结果 ancestor 选取当前节点的所有先辈(父.祖父等).

xpath 轴定位表达方式

xpath的使用基本语法: 1.// 从根节点开始,查找对象是全文. 2./ 从当前标签的路径开始查找 3.text()获取当前路径下的文本 [email protected]+类名或者id名 查找类名或者id的名字 5. .一个点表示当前节点 (1)获取某个标签的内容 (2)根据标签属性来查找指定的标签,获取指定标签的属性 (3)找指定的文本内容 (4)获取指定id名字的标签的文本 (5)获取指定类名的文本 (6)contains包含指定属性 轴运算名称: ancestor::* 表示当前节点

XPath 轴 Axes

轴名称 描述 child 选取当前节点的所有子元素 parent 选取当前节点的父节点 descendant 选取当前节点的所有后代元素(子.孙等) ancestor 选取当前节点的所有先辈(父.祖父等) descendant-or-self 选取当前节点的所有后代元素(子.孙等)以及当前节点本身 ancestor-or-self 选取当前节点的所有先辈(父.祖父等)以及当前节点本身 preceding-sibling 选取当前节点之前的所有同级节点 following-sibling 选取当前

Selenium Webdriver——Xpath轴定位

1.following-sibling 选择当前元素后的兄弟元素 html如下: <div class="controls"> <div class="qcbox qcity" style="z-index: 40;"> <div class="qunar-qcbox"> <div class="qcbox-placeholder" style="widt

Selenium Webdriver——Xpath轴定位(preceding)

 1.preceding-sibling 选取当前节点之前的所有同级节点 text=出发之前的同级节点: 2.preceding 选取当前节点开始标签之前的所有节点 text=出发节点标签之前的所有input标签节点

XPath学习:轴(3)——descendant

转自:http://www.cnblogs.com/zhaozhan/archive/2009/09/10/1563723.html 感谢无风 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_

XPath Axes(轴)

XML 实例文档 我们将在下面的例子中使用此 XML 文档: <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title lang="eng">Harry Potter</title> <price>29.99</price> </book> <book> &l

Dom4j和Xpath(转)

1.DOM4J简介 DOM4J是 dom4j.org 出品的一个开源 XML 解析包.DOM4J应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM,SAX 和JAXP. DOM4J使用起来非常简单.只要你了解基本的 XML-DOM 模型,就能使用. Dom:把整个文档作为一个对象. DOM4J 最大的特色是使用大量的接口.它的主要接口都在org.dom4j里面定义: 魂牵梦萦 魂牵梦萦 魂牵梦萦 Attribute 定义了 XML 的属性. Branch 指能够包含子节点的节点

【转】 HTML解析:基于XPath的C#类库HtmlAgiliytyPack

[转] HTML解析:基于XPath的C#类库HtmlAgiliytyPack 最近处于毕业设计开始阶段,前期工作需要去国外的一些专业数据库网站比对一些所需TF家族信息,为了快捷方便,想到用程序去帮助实现.前期实现了一系列的尝试,使用C#的的网络编程类库,获取查询结果,但是为了分析其中的结果并进行比对,我最开始尝试了两天之久的正则表达式,最后发现在解析这样的HTML文档的时候,花费时间太多,因此开始改变策略,最后得知MSHTML和HAP这两个.NET解析html的类库,出于对HAP这个轻量级类库