XPath概述

1. XPath

具体示例可参考网址：

http://www.zvon.org/xxl/XPathTutorial/General/examples.html

1.1 概述

*

现节点下所有元素

*/Elem

现节点下所有节点的字节点中为“Elem”的节点

@Prop

属性值

@*

所有属于现节点的属性

.

现节点

..

现节点的上级

Elem[i]

现节点下第i个叫做Elem的元素(从1开始）

Elem[position() = 1]

同上

Elem/[@prop=“somevalue”]

现节点下，名字为Elem，具有prop的属性，并且属性值为somevalue的，那个元素

Elem1|elem2

现节点下，名字为Elem1或elem2的元素

.//elem

现节点下，可以跨越级别，所有的名字叫做elem的元素

Elem1//elem2

现节点下，可以跨越级别，所有的名字叫做elem2，且elem2的上级中有人叫Elem1，且Elem1是现节点的子元素，的元素

=

!=

<

<=

>

>=

text()

现节点的子元素中所有的文字节点

count()

count(PERSON[name=‘tom’])

number()

select=“number(book/price)”

substring(value,start,length)

select=“substring(name,1,3)”

sum()

select=“sum(//price)”

1.2 XPath数据类型

XPath可分为四种数据类型：

节点集(node-set)
节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。
布尔值(boolean)
由函数或布尔表达式返回的条件匹配值，与一般语言中的布尔值相同，有true和 false两个值。布尔值可以和数值类型、字符串类型相互转换。
字符串(string)
字符串即包含一系列字符的集合，XPath中提供了一系列的字符串函数。字符串可与数值类型、布尔值类型的数据相互转换。
数值(number)
在XPath中数值为浮点数，可以是双精度64位浮点数。另外包括一些数值的特殊描述，如非数值NaN（Not-a-Number）、正无穷大infinity、负无穷大-infinity、正负0等等。number的整数值可以通过函数取得，另外，数值也可以和布尔类型、字符串类型相互转换。

其中后三种数据类型与其它编程语言中相应的数据类型差不多，只是第一种数据类型是XML文档树的特有产物。

1.3 XPath节点类型

另外，由于XPath包含的是对文档结构树的一系列操作，因此搞清楚XPath节点类型也是很必要的。回忆一下第二章中讲到的XML文档的逻辑结构，一个XML文件可以包含元素、CDATA、注释、处理指令等逻辑要素，其中元素还可以包含属性，并可以利用属性来定义命名空间。相应地，在XPath中，将节点划分为七种节点类型：

根节点（Root Node）
根节点是一棵树的最上层，根节点是唯一的。树上其它所有元素节点都是它的子节点或后代节点。对根节点的处理机制与其它节点相同。在XSLT中对树的匹配总是先从根节点开始。
元素节点（Element Nodes）
元素节点对应于文档中的每一个元素，一个元素节点的子节点可以是元素节点、注释节点、处理指令节点和文本节点。可以为元素节点定义一个唯一的标识id。元素节点都可以有扩展名，它是由两部分组成的：一部分是命名空间URI，另一部分是本地的命名。
文本节点（Text Nodes）
文本节点包含了一组字符数据，即CDATA中包含的字符。任何一个文本节点都不会有紧邻的兄弟文本节点，而且文本节点没有扩展名。
属性节点（Attribute Nodes）
每一个元素节点有一个相关联的属性节点集合，元素是每个属性节点的父节点，但属性节点却不是其父元素的子节点。这就是说，通过查找元素的子节点可以匹配出元素的属性节点，但反过来不成立，只是单向的。再有，元素的属性节点没有共享性，也就是说不同的元素节点不共有同一个属性节点。
对缺省属性的处理等同于定义了的属性。如果一个属性是在DTD声明的，但声明为 #IMPLIED，而该属性没有在元素中定义，则该元素的属性节点集中不包含该属性。
此外，与属性相对应的属性节点都没有命名空间的声明。命名空间属性对应着另一种类型的节点。
命名空间节点（Namespace Nodes）
每一个元素节点都有一个相关的命名空间节点集。在XML文档中，命名空间是通过保留属性声明的，因此，在XPath中，该类节点与属性节点极为相似，它们与父元素之间的关系是单向的，并且不具有共享性。
处理指令节点（Processing Instruction Nodes）
处理指令节点对应于XML文档中的每一条处理指令。它也有扩展名，扩展名的本地命名指向处理对象，而命名空间部分为空。
注释节点（Comment Nodes）
注释节点对应于文档中的注释。

1.4 一个XML文档树

我们来构造一棵XML文档树，作为后面举例的依托：

<A id="a1">

<B id="b1">

<C id="c1">

<B name="b"/>

<D id="d1"/>

<E id="e1"/>

<E id="e2"/>

</C>

</B>

<B id="b2"/>

<C id="c2">

<B/>

<D id="d2"/>

<F/>

</C>

<E/>

</A>

以下将要介绍一些XPath中节点匹配的基本方法。

1.5 路径匹配

路径匹配与文件路径的表示相仿，比较好理解。有以下几个符号：

（1）用“/”指示节点路径
如“/A/C/D” 表示节点"A"的子节点"C"的子节点"D"，即id值为d2的D节点， “/”表示根节点。

（2）用“//” 表示所有路径以"//"后指定的子路径结尾的元素
如“//E” 表示所有E元素，结果是所有三个E元素，如“//C/E”表示所有父节点为C的E元素，结果是id值为e1和e2的两个E元素。

（3）用“*” 表示路径的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素，即name值为b的B元素、 id值为d1的D元素和id值为e1和e2的两个E元素
“/*/*/D”表示上面有两级节点的D元素，匹配结果是id值为d2的D元素，如“//*”表示所有的元素。

1.6 位置匹配

对于每一个元素，它的各个子元素是有序的。

如：/A/B/C[1]表示A元素→B元素→C元素的第一个子元素，得到name值为b的B元素

/A/B/C[last()]表示A元素→B元素→C元素的最后一个子元素，得到id值为e2的E元素

/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置号大于1的元素，得到id值为d1的D元素和两个具有id值的E元素

1.7 属性及属性值

在XPath中可以利用属性及属性值来匹配元素，要注意的是，元素的属性名前要有"@"前缀。例如：

//B[@id]表示所有具有属性id的B元素，结果为id值为b1和b2的两个B元素

//B[@*]表示所有具有属性的B元素，结果为两个具有id属性的B元素和一个具有name属性B元素

//B[not(@*)]表示所有不具有属性的B元素，结果为A元素→C元素下的B元素

//B[@id="b1"] id值为b1的B元素，结果为A元素下的B元素

1.8 亲属关系匹配

XML文档可归结为树型结构，因此任何一个节点都不是孤立的。通常我们把节点之间的归属关系归结为一种亲属关系，如父亲、孩子、祖先、后代、兄弟等等。在对元素进行匹配时，同样可以用到这些概念。例如：

//E/parent::* 表示所有E节点的父节点元素，结果为id值为a1的A元素和id值为c1的C元素

//F/ancestor::* 表示所有F元素的祖先节点元素，结果为id值为a1的A元素和id值为c2的C元素

/A/child::* 表示A的子元素，结果为id值为b1、b2的B元素，id值为c2的C元素，以及没有任何属性的E元素

/A/descendant::* 表示A的所有后代元素，结果为除A元素以外的所有其它元素

//F/self::* 表示所有F的自身元素，结果为F元素本身

//F/ancestor-or-self::* 表示所有F元素及它的祖先节点元素，结果为F元素、F元素的父节点C元素和A元素

/A/C/descendant-or-self::* 表示所有A元素→C元素及它们的后代元素，结果为id值为c2的C元素、该元素的子元素B、D、F元素

/A/C/following-sibling::* 表示A元素→C元素的紧邻的后序所有兄弟节点元素，结果为没有任何属性的E元素

/A/C/preceding-sibling::* 表示A元素→C元素的紧邻的前面所有兄弟节点元素，结果为id值为b1和b2的两个B元素

/A/B/C/following::* 表示A元素→B元素→C元素的后序的所有元素，结果为id 为b2的B元素、无属性的C元素、无属性的B元素、id为d2的D元素、无属性的F元素、\无属性的E元素。

/A/C/preceding::* 表示A元素→C元素的前面的所有元素，结果为id为b2的B元素、id为e2的E元素、id为e1的E元素、id为d1的D元素、name为 b的B元素、id为c1的C元素、id为b1的B元素

1.9 条件匹配

条件匹配就是利用一些函数的运算结果的布尔值来匹配符合条件的节点。常用于条件匹配的函数有四大类：节点函数、字符串函数、数值函数、布尔函数。例如last()、position()等等，这里我们就不再赘述。

以上这些匹配方法中，用得最多的还要数路径匹配。在上一章样式表的例子中，无论是在语句<xsl:template match="学生花名册">中，还是在语句 <xsl:value-of select="名字"/>中，都是依靠给出相对于当前路径的子路径来定位节点的。

XPath概述,布布扣,bubuko.com

时间： 2024-12-28 00:53:41

XPath概述的相关文章

XML概念，约束文档，解析

day01总结今日内容 l XML语法 l XML约束之DTD l XML解析器介绍 l XML解析之JAXP( DOM.SAX ) l DOM4J l Schema 一.XML语法 XML概述 1 什么是XML XML全称为Extensible Markup Language, 意思是可扩展的标记语言,它是 SGML(标准通用标记语言)的一个子集. XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的. W3C在1998年2月发布1.0版本: W3C

Day06 DOM4J&schema介绍&xPath

day06总结今日内容 XML解析之JAXP( SAX ) DOM4J Schema ? 三.XML解析器介绍 ? 操作XML文档概述 ? 1 如何操作XML文档 XML文档也是数据的一种,对数据的操作也不外乎是"增删改查".也被大家称之为"CRUD". C:Create: R:Retrieve: U:Update: D:Delete ? 2 XML解析技术 XML解析方式分为两种:DOM(Document Object Model)和SAX(Simple API

JavaScripts学习日记——DOM SAX JAXP DEMO4J XPath

今日关键词: XML解析器 DOM SAX JAXP DEMO4J XPath XML解析器 1.解析器概述什么是解析器 XML是保存数据的文件,XML中保存的数据也需要被程序读取然后使用.那么程序使用什么来读取XML文件中的数据呢?XML解析器!例如.properties文件的解析器是Properties类一样! XML不只被Java语言使用,还被C++.C#.Javascript等等语言使用,所以解析XML不是一门语言的工作! DOM和SAX介绍主流的XML解析有两种标准:DOM和SAX

MockService脚本概述

虽然静态MockOperation和MockResponse模型可以给你一定的灵活性,更多的动态行为添加到您的服务让您更模拟复杂的服务功能是很有用的.例如,你可能想: 从请求到响应传输值,修改它们的值看了一些数据的请求,并根据它的值来选择要返回的响应从数据库读取响应手动创建一个自定义HTTP响应等等... 让我们来看看如何在特定的实现这些,但我们会首先给你,你如何让你的MockServices更动态的概述. 1. MockService脚本概述对于MockService本身有很多可用的

XPath与Xquery

XPath 和 XQuery 在某些方面很相似.XPath 还是 XQuery 完整不可分割的一部分.这两种语言都能够从 XML 文档或者 XML 文档存储库中选择数据.本文简要介绍了 XPath 和 XQuery,以及如何使用 XQuery 对 XPath 的扩展. 虽然 XPath 和 XQuery 都能实现一些相同的功能,但是 XPath 比较简洁而 XQuery 更加强大和灵活.对于很多查询来说 XPath 非常合适.比如,从 XML 文档中的部分记录建立电话号码的无序列表,使用 XPa

jQuery 入门教程(一): 概述

jQuery是一套跨浏览器的JavaScript函式库,简化HTML与JavaScript之间的操作,下面为摘自Wikepedia上的jQuery说明: jQuery 是开源软件,使用MIT许可证授权.[4] jQuery的语法设计使得许多操作变得容易,如操作文档对象(document).选择DOM元素.创建动画效果.处理事件.以及开发Ajax程序.jQuery 也提供了给开发人员在其上创建插件的能力.这使开发人员可以对底层交互与动画.高级效果和高级主题化的组件进行抽象化.模块化的方式使 jQu

JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析（8）

1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出.语法:<![CDATA[ 内容 ]]> <![CDATA[ <book> <br/> </book> ]]> 2.处理指令处理指令,简称PI (processing instruction).处理指令用来指挥解析引擎如何解析XML文

爬虫入门之爬取策略 XPath与bs4实现(五)

爬虫入门之爬取策略 XPath与bs4实现(五) 在爬虫系统中,待抓取URL队列是很重要的一部分.待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面.而决定这些URL排列顺序的方法,叫做抓取策略.下面重点介绍几种常见的抓取策略: 1 深度优先遍历策略: 深度优先遍历策略是指网络爬虫会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接.我们以下面的图为例:遍历的路径:A-F-G E-H-I B C D

第一课 MongoDB 概述与安装

1.课程大纲本次课主要介绍 MongoDB 背景知识和 MongoDB 的安装与配置,让大家对 MongoDB 有一个初认识. 其基本的知识点包含: NoSQL数据库概述 MongoDB 数据库简单介绍 Linux 下安装 MongoDB 数据库 Mac 和 Windows 下安装 MongoDB 数据库 2.课程简单介绍 MongoDB是由MongoDB.inc研发的一款NoSQL类型的文档型数据库,MonogoDB名字来源于英文单词humongous,这个单词的意思是巨大无比.暗喻Mong

猜你喜欢

设置局域网共享权限问题

1. 在dos窗口中利用ping命令检测网络是否畅通. 2.设置文件和打印机共享服务. 3.确定访问端电脑跟共享端电脑在局域网内的同一工作组里并且查明共享主机名称打开计算机-> 系统属性-&g ...

review what i studied `date` - 2017-4-6

#vim 内部命令: :g/abc/d #删除所有有abc的行 example: :g/^#/d #删除所有以#号开头的行 :g/^$/d #删除所有空行 :v/abc/d #删除所有没有abc的行 ...

Apache Hadoop 3.0.0-alpha1，重写 Shell 脚本

Apache Hadoop 3.0.0-alpha1发布了. 部分更新内容: Hadoop 3.0.0-alpha1在Java 8下编译,使用Java 7以及以下版本需更新到Java 8 重写了she ...

C#读取shp的属性信息

一个完整的ESRI的shape文件包括一个主文件,一个索引文件,和一个dBASE表文件.主文件是一个直接存取,变记录长度文件,其中每个记录描述一个由其顶点列表组成的shape.在索引文件中,每条记录 ...

POJ 2159

稍加分析后,你会发现,就是统计次数而已 #include <iostream> #include <cstdio> using namespace std; int a[110 ...

“互联网+”背景下使用微信公众号增强班主任工作与整合教学资源（泰微课）

前记:此文是我爱人一项作业.因为我本人对于微信这一块比较熟悉,就参与这项作业中.此文已经参加移动和教育相关活动.作者是我爱人,如有转载请署名作者. 一.什么是"互联网+"? 早在1 ...

BZOJ2748 [HAOI2012]音量调节

Description 一个吉他手准备参加一场演出.他不喜欢在演出时始终使用同一个音量,所以他决定每一首歌之前他都要改变一次音量.在演出开始之前,他已经做好了一个列表,里面写着在每首歌开始之前他想要改 ...

系统设计

系统设计概述系统设计的目标是根据系统分析的结果,完成系统的构件过程.其主要目的是绘制系统的蓝图,权衡和比较各种技术和实施方法的利弊,合理分配各种资源,构建新系统的设计方案和相关模型,指导系统实施工作 ...

shell脚本（1）

今天小编为大家讲的是shell脚本,这一块在我们Linux占了很大的分量,小编想了好久,还是觉的用练习题来讲述更具有说服力,小编会把每个解题的亮点与重点指出来. 1.编写脚本/root/bin/cre ...

VBS基础篇 - 过程（sub 与 Function）

VBS基础篇 - 过程(sub 与 Function) 在VBscript中,有两种procedure:Sub procedure与Function procedure Sub过程:是包含在 Sub ...

android线程学习心得

有一篇关于android线程讲的非常好,大家可以参考下,其中有一句话讲的非常好,就拿来做开篇之句: 当一个程序第一次启动时,Android会同时启动一个对应的主线程(Main Thread),主线程主 ...

[原]零基础学习SDL开发之在Android使用SDL2.0加载字体

在上一篇文章我们知道了如何在android使用SDL2.0来渲染显示一张png图,而且在上上一篇我们知道如何使用sdl来渲染输出bmp图,那么sdl是否可以渲染输出自己喜爱的字体库的字体呢?答案是当然 ...

上帝美好的应许

当你看不清方向的时候,上帝说:忘记背后,努力面前,向着标杆直跑. 当你怒气难当的时候,上帝说:不可含怒到日落.不轻易发怒的人,大有智慧. 当你对别人冷漠的时候,上帝说:你要心里火热,要爱人如 ...

echarts图表里label文字过长换行的方法

在做一些图标时,有时会出现显示文字过长的问题,需要将其按照指定的字数换行,像下图这样而echarts没有提供换行的方法,但是可以使用fomatter方法进行设置,代码如下 formatter: fu ...

ExtJS4.2学习(20)动态数据表格之前几章总结篇1（转）

鸣谢:http://www.shuyangyang.com.cn/jishuliangongfang/qianduanjishu/2014-02-18/196.html --------------- ...

【原】移动web滑屏框架分享

本月26号参加webrebuild深圳站,会上听了彪叔的对初心的讲解,“工匠精神”这个词又一次被提出,也再次引起了我对它的思考.专注一个项目并把它做得好,很好,更好...现实工作中,忙忙碌碌,抱着完成 ...

1221——visual2012基本操作、数据类型、类型转换

基本操作 //输出 Console.WriteLine("这是一行文字");自动回车. Console.write("Hello world ");不带回车. ...

满满的吐槽

1.关于罗桑和刘翔约炮锤子要是真这么不耐摔,若我是刘翔,当场就拿锤子和苹果三星摔给老罗看. 锤子要是屏幕真这么翔,若我是刘翔,当场就和nexus5/iPhone比. 锤子要是这么怕静电,若我是刘翔, ...

nj10---文件读取

介绍:fs模块是文件操作的封装,它提供了文件的读取,写入,更名,删除,遍历目录,链接POSIX文件系统操作.与其他模块不同的是,fs模块中所有的操作都提供了异步和同步两个版本,例如读取文件内容函数异步 ...

Storm 官方文档翻译 --- 消息的可靠性保障

消息的可靠性保障 Storm 能够保证每一个由 Spout 发送的消息都能够得到完整地处理.本文详细解释了 Storm 如何实现这种保障机制,以及作为用户如何使用好 Storm 的可靠性机制. 消息的 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.022 s.