chrome浏览器安装Xpath Helper插件

最近偷空研究了一下python,准备用python写一个爬虫。

在使用scrapy,爬取网页信息时,我需要去定位节点,所以也就有了下面这篇文章。

例子代码:

 1 import scrapy
 2 from tutorial.items import DemozItem
 3
 4 class DmozSpider(scrapy.Spider):
 5     name = "dmoz"
 6     allowed_domains = ["dmoz.org"]
 7     start_urls = [
 8         "file:///D:/pyscrapy/tutorial/tutorial/spiders/test.html"
 9     ]
10     def parse(self, response):
11         #将爬取的数据以Item对象的形式返回
12         for sel in response.xpath("//p/a[@name=‘链接‘]"):
13             #item = DemozItem()
14             list = sel.xpath(‘text()‘).extract()
15             if len(list) != 0:
16                 print(list[0].replace(‘ ‘, ‘‘))

从例子代码中可以看到xpath()方法中的参数为xpath路径表达式。我要去写我所需要信息的xpath,才能抓取到我需要的信息,所以书写xpath表达式是必然的。

在探索中我找到了一个可以很方便查找xpath表达式的插件,由于我是chrome浏览器所以安装这个插件网上很多介绍,你可以去这里下载并了解这个插件:在这里 这里面讲解很详细包括安装和使用。

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。(W3School 中有一些用法)

获取父节点的使用方式:

获取name为“现病史”结点父节点的父节点(p):

可以看到表达式锁定的p颜色为标记为了黄色。

//span[1]/a[@name=‘现病史‘]/parent::node()[1]/parent::node()

获取子节点(child::node()[1]代表取子节点的第一个,如果不写则是取所有):

可以看到一共匹配了376个结果,当前是第九个满足匹配的节点。

原文地址:https://www.cnblogs.com/liudaihuablogs/p/9301059.html

时间: 2024-10-12 04:24:02

chrome浏览器安装Xpath Helper插件的相关文章

chrome浏览器安装网页测试插件postman的图文步骤记录

用户在开发或者调试网络程序或者是网页B/S模式的程序的时候是需要一些方法来跟踪网页请求的,用户可以使用一些网络的监视工具比如著名的Firebug等网页调试工具.今天给大家介绍的这款网页调试工具不仅可以调试简单的css.html.脚本等简单的网页基本信息,它还可以发送几乎所有类型的HTTP请求!Postman在发送网络HTTP请求方面可以说是Chrome插件类产品中的代表产品之一. Postman插件下载与安装Postman插件哪里可以下载? 1.你可以从chrome应用商店里找到Postman插

chrome浏览器的VUE调试插件Vue.js devtools

chrome浏览器的VUE调试插件Vue.js devtools 应用商店直接安装 安装成功后在VUE文件打开可以直接调试: 提示效果如下: F12进入调试状态即可: 安装中出现的问题: 插件安装后无法使用,出现vue.js not detected提示的解决办法 找到插件的安装目录: (可以通过id搜索ID:nhdogjmejiglipccpnnnanhbledajbpd) C:\Users\liangsuya\AppData\Local\Google\Chrome\User Data\Def

关于Chrome浏览器不能使用Java插件的问题

最近测试的“上海电信宽带测速系统”中HTTP测试需要用到java插件,之前装过好多次插件,装好后还是提示java插件未安装,郁闷了N久,最近问题终于得到了解决,故做分享~ 关于Chrome浏览器不能使用Java插件的问题,需要在chrome://flags/#enable-npapi启动NPAPI插件才行.    启用后,试了下还是不行,索性将java插件更新至最新版本,下载了java8 32位的插件做安装.安装完成后,一切都OK,搞定.同时将之前存在的IE9 32位的插件问题也搞定了(IE93

Chrome 浏览器的Secure Shell插件

说起putty,windows下面的程序猿个个都是爱恨交加. 不小心发现一个宝贝,Chrome 浏览器的Secure Shell插件. 这是Google官方推出的插件,试用下来,putty完全可以下岗了嘛! 强烈推荐, 请戳 http://t.cn/zjDfw0U

给Debian浏览器安装flash播放插件

sudo apt-get install flashplugin-nonfree   给Debian浏览器安装flash播放插件

Chrome 浏览器安装 ChroPath 插件

1.下载地址 http://www.cnplugins.com/devtool/chropath/download.html 2.安装方法 a.把下载的文件更改后缀名变为压缩包,然后解压到本地:如下图: b. 然后打开Chrome 浏览器 进入到扩展程序页面,打开 页面右上角的 开发者模式 c.安装完成以后,在开发者面板既可以查看到: 原文地址:https://www.cnblogs.com/zddwork/p/11780977.html

chrome浏览器安装react-devtools插件

1.进入https://github.com/facebook/react-devtools 在自述文件中可以看到如下图提示 扩展的v3的源代码可以在v3分支中找到 2.进入https://github.com/facebook/react-devtools/tree/v3 下载解压文件 3.进入react-devtools-3文件夹 运行 npm install 命令 4.运行 npm run build:extension:chrome命令 出现如下图 5.在chrome浏览器扩展程序中点击

Chrome浏览器获取XPATH的方法----通过开发者工具获取

还在为xpath的正确性而犯愁吗?难道必须得装一个Firefox浏览器,安装一个插件? No!!!!!!! 有了chrome浏览器,照样能获取xpath,而且保证正确. 具体的使用方法?请往下看. chrome有自己的开发者工具,可以用这儿来直接获取xpath,都不用担心正确性了. 具体使用步骤如下: 1.在chrome浏览器的右上角有个选择菜单,也就是这个,点一下: 2.在列表最后面有个"更多工具",点击一下,就可以看到开发者工具了. 3.打开开发者工具后,点击开发者工具中第一行的第

手把手教你Chrome浏览器安装Postman(含下载云盘链接)(转)

文章转自http://www.ljwit.com/archives/php/278.html 说明: Postman不多介绍,是一款功能强大的网页调试与发送网页HTTP请求的Chrome插件.本文主要介绍下安装过程. 本文使用的是解压文件直接进行安装.是比较快速有效的安装方式,当然也可以去goole的在线商店去直接安装,可是你要FQ才行. 压缩文件在文后! 第一步:把下载后的.crx扩展名的离线Chrome插件的文件扩展名改成.zip或者.rar(如果看不到Chrome插件的扩展名请百度搜索相关