htmlcleaner使用及xpath语法

一、HtmlCleaner

1、创建htmlCleaner对象

HtmlCleaner htmlCleaner = new HtmlCleaner();

2、调用clean方法

TagNode tagNode = htmlCleaner.clean(html内容或url);

3、使用XPath

Object[] aArr = tagNode.evaluateXPath("//div[@class=‘breadcrumb‘]//a");

二、XPath

例:div,属性class为breadcrumb下面的所有a标签

//div[@class=‘breadcrumb‘]//a

常用路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

参考资料

http://blog.csdn.net/reesun/article/details/8021201

时间: 2024-10-13 19:59:29

htmlcleaner使用及xpath语法的相关文章

XPath语法 在C#中使用XPath示例

XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识. 示例Xml: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 <?xml version="1.0" encoding="utf-8" ?> <pets>   <cat color="black"

XML——XPATH语法介绍

为什么需要xpath? 在使用dom4j的时候,我们不能跨层获取某一个元素,必须一层一层去获取,这就非常麻烦. 所以为了我们更方便地访问某个节点,我们可以使用xpath技术,它可以让我们非常方便地读取到指定节点. xpath通常结合dom4j配合使用,而且如果要使用xpath,则需要引入一个新的包jaxen-1.1-beta-6.jar xpath的基础语法有以下几点: 1.基本的xpath语法类似于在一个文件系统中定位文件,如果路径以斜线/开始,那么该路径就表示到一个元素的绝对路径. (1)/

PowerShell技巧:使用XPath语法查询XML文件

[TechTarget中国原创] XML是存储结构化数据的一个很好的途径,但是想要让数据在其中发挥作用又会有些困难.每一种语言都有其特定方式来查询XML文件中的命名空间.元素及属性.PowerShell也不例外.PowerShell在查询XML文件时会略有不同,而该技巧主要依赖于Select-Xml命令和XPath语法上. XPath是定义XML文件组成的语言.XPath早在1999年就已经存在,一直被用于查询XML文件最标准的方法. XPath将XML文件定义为树.XML文件中的每个节点都节点

[XPath/Python] XPath 与 lxml (二)XPath 语法

XPath 选取节点时使用的表达式是一种路径表达式.节点是通过路径(path)或者步(steps)来选取的. 本章使用以下 XML 文档作为示例. <?xml version="1.0" encoding="utf8"?> <bookstore> <book> <title lang="eng">Harry Potter</title> <price>29.99</pr

XPath 语法规则

http://www.cnblogs.com/michaelsea/archive/2007/10/18/929230.html XPath is a language for finding information in an XML document. XPath is used to navigate through elements and attributes in an XML document. Xpath是一种能够在XML文档中寻找信息的语言.它通过XML文档中的元素和属性来进行

XPath语法 在C#中使用XPath示例 【转http://www.cnblogs.com/yukaizhao/archive/2011/07/25/xpath.html】非常详细的文章

XPath语法 在C#中使用XPath示例 XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识. 示例Xml: <?xml version="1.0" encoding="utf-8" ?> <pets> <cat color="black" weight="10"> <price>100</price>

Xpath语法学习

贴几个我学习Xpath的参考 1 基本使用的参考 XPath学习:基本语法(一) 2 较为详细且清晰例子参考 XPath 语法 3 详细语法参考 Xpath语法格式整理 4 官方参考 XPath 教程 XPath学习:基本语法(一)

XPath语法 在C#中使用XPath例子与用法

XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识.示例Xml: <?xml version="1.0" encoding="utf-8" ?> <pets> <cat color="black" weight="10"> <price>100</price> <desc>this is a b

xpath语法速查

xpath的具体学习可以通过w3c查看(链接:http://www.w3school.com.cn/xpath/index.asp) 这里只是将平时用到的几个表格贴出来,以后查询: 这里的xpath我个人觉得像选择器,有 语法+xpath轴运算+运算符+函数 几个结合使用. 函数很多,不贴出来了,需要的可以通过w3c查询:http://www.w3school.com.cn/xpath/xpath_functions.asp XPath 语法 选取节点 XPath 使用路径表达式在 XML 文档