Python开发包推荐系列之xml、html解析器PyQuery

使用python,喜欢她的简洁是一方面,另外就是它有着丰富的开发包 好用又方便 接下来会给大家推荐一系列很赞的开发包。

在解析html、xml过程中,我们有不少的包可以用。比如bs、lxml、xmltodict等 如果说你想立即上手,那么pyquery必然是最佳之选。

从名字上就可以看出,她一定和jQuery有着一定的关系

在官方网站上就是这样描述它的

pyquery: a jquery-like library for python

没错,作者就是将html、xml的解析接口封装成了类似jQuery的方法

赶快看看如何应用吧

官网:http://pythonhosted.org/pyquery/#

安装:pip install pyquery

来个实例开始吧

pyquery接受多种输入:字符串、etree对象、url及filename对象,这还不是重点,看下面列子

细心的朋友可以看到,我们在输入的xml字符串中并不是标准的xml格式,标签不匹配。

但是pq依然可以正常处理,对于一些经常想小爬网页的朋友简直了~ 很赞吧

好了,更多方法大家可以到官网看文档尝试http://pythonhosted.org/pyquery/#

今天的推荐就到这里啦, 下期有更精彩的开发包推荐

欢迎关注公众号”人生苦短我用Python“


时间: 2024-10-22 19:22:32

Python开发包推荐系列之xml、html解析器PyQuery的相关文章

PHP XML Expat 解析器

PHP XML Expat 解析器 内建的 Expat 解析器使在 PHP 中处理 XML 文档成为可能. XML 是什么? XML 用于描述数据,其焦点是数据是什么.XML 文件描述了数据的结构. 在 XML 中,没有预定义的标签.您必须定义自己的标签. 如需学习更多关于 XML 的知识,请访问我们的 XML 教程. Expat 是什么? 如需读取和更新 - 创建和处理 - 一个 XML 文档,您需要 XML 解析器. 有两种基本的 XML 解析器类型: 基于树的解析器:这种解析器把 XML

XML文件解析器TXml

前几天看了开源的XML文件解析器TinyXml,它是怎么实现解析的没怎么看懂,于是决定自己实现一个,反正最近不忙.先命名为TXml.现在完成了解析和查询功能,全部代码加起来不到1000行,将会继续完善它.源码必共享 先简单说一下我的思路: 1:读取XML文件信息,并存入一个字符数组中: 2:遍历数组,将数组解析成一棵树: 3:以路径的方式查询和按属性查询: 这个解析器最麻烦的地方就在怎么将字符数组解析成一颗树.我们先看一下一个简单XML文件,他包括文件头.节点.节点名称及节点值.属性名称及属性值

雷林鹏分享:PHP XML Expat 解析器

内建的 Expat 解析器使在 PHP 中处理 XML 文档成为可能. XML 是什么? XML 用于描述数据,其焦点是数据是什么.XML 文件描述了数据的结构. 在 XML 中,没有预定义的标签.您必须定义自己的标签. 如需学习更多关于 XML 的知识,请访问我们的 XML 教程. Expat 是什么? 如需读取和更新 - 创建和处理 - 一个 XML 文档,您需要 XML 解析器. 有两种基本的 XML 解析器类型: 基于树的解析器:这种解析器把 XML 文档转换为树型结构.它分析整篇文档,

XML DOM 解析器

大多数浏览器都内建了供读取和操作 XML 的 XML 解析器. 解析器把 XML 转换为 JavaScript 可存取的对象(XML DOM). XML 解析器 XML DOM 包含了遍历 XML 树,访问.插入及删除节点的方法(函数). 然而,在访问和操作 XML 文档之前,它必须加载到 XML DOM 对象. XML 解析器读取 XML,并把它转换为 XML DOM 对象,这样才可以使用 JavaScript 访问它. 大多数浏览器有一个内建的 XML 解析器. 加载 XML 文档 下面的

Rails 4.0 移除了 XML 参数解析器。若要使用请加入 actionpack-xml_parser

拜读了用 Rails 搭建微信公众平台 API之后发现, params[:xml]这个办法在Rails 4里面已经被办掉了,于是就看了一下Rails 4的新特性发现XML Parameter parsing has been sent to a plugin. http://www.rubydoc.info/github/rails/actionpack-xml_parser actionpack-xml_parser A XML parameters parser for Action Pac

Spring MVC-视图解析器(View Resolverr)-XML视图解析器(Xml View Resolver)示例(转载实践)

以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_xmlviewresolver.htm 说明:示例基于Spring MVC 4.1.6. XmlViewResolver用于使用在xml文件中定义的视图bean来解析视图名称.以下示例显示如何使用Spring Web MVC框架使用XmlViewResolver. TestWeb-servlet.xml <bean class="org.springframework.we

Spring MVC Xml视图解析器

XmlViewResolver用于在xml文件中定义的视图bean来解析视图名称.以下示例演示如何在Spring Web MVC框架使用XmlViewResolver. XmlViewResolver-servlet.xml 配置如下所示 - <bean class="org.springframework.web.servlet.view.XmlViewResolver"> <property name="location"> <va

安装python-devel开发包

1.概述 有时在安装某些软件的时候,会报错: Error: must have python development packages for 2.4, 2.5, 2.6 or 2.7. Could not find Python.h.Please install python2.4-devel, python2.5-devel, python2.6-devel or python2.7-devel 这是因为缺少python开发包的原因. 2.解决方案 如果你使用的是centOS系统,或者支持y

Spring 4 MVC 视图解析器(XML JSON PDF等) 纯注解(带源码)【推荐】

原文地址:http://websystique.com/springmvc/spring-4-mvc-contentnegotiatingviewresolver-example/ [本系列其他教程正在陆续翻译中,点击分类:spring 4 mvc 进行查看.源码下载地址在文章末尾.] [翻译 by 明明如月 QQ 605283073] 下一篇:Spring 4 MVC @RestController 注解实现REST Service 上一篇:Spring 4 MVC 表单校验资源处理(带源码)