Pyquery的安装

无论Linux还是Mac, 要安装pyquery都不是一件容易的事儿

主要是lxml的依赖较多,且需要手动安装

cat /etc/redhat-release
CentOS release 6.6 (Final)

1>>python-dev

yum install gcc libffi-devel python-devel openssl-devel

2>>libxslt, libxml

curl -o libxslt-1.1.29.zip https://git.gnome.org/browse/libxslt/snapshot/libxslt-1.1.29.zip

curl -o libxml-1.7.3.tar.gz http://xmlsoft.org/sources/old/libxml-1.7.3.tar.gz

但是为何安装完了还是各种错误呢!

搜索StackOverflow

yum instal libxslt-devel

然后也就安装成功了

Pyquery使用是特别方便的

# -*- coding:utf-8 -*-
import requests
from pyquery import PyQuery as pq

headers = {
    ‘User-Agent‘:"Mozilla/5.0 (Macintosh; Intel Mac OS X 10.11; rv:45.0) Gecko/20100101 Firefox/45.0",
    ‘Cookie‘:"UOR=y.qq.com,widget.weibo.com,y.qq.com; SINAGLOBAL=8818090954579.496.1461652869389; ULV=1466417097935:5:3:2:4821515600800.323.1466417097929:1466410712129; SUB=_2AkMgEzhXf8NhqwJRmP0WyGPjbol3yw7EieLBAH7sJRMxHRl-yT83qnEItRAP-q6huRFAXpidMwh9ScHwNyuDMw..; SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9WFzaPQwqvOukuGw_aqZrYOD; YF-V5-G0=c998e7c570da2f8537944063e27af755; YF-Page-G0=ffe43932f05408fcdf32c673d8997f97"
}

s = requests.Session()
url = ‘http://weibo.com/aj/v6/comment/big?ajwvr=6&id=3995838911192732&page={}&__rnd=1468201664629‘
def save(page):
    try:
        r = s.get(url.format(page), headers=headers)
        print r.url
    except Exception, e:
        print e
        exit(0)
    v_source = pq( r.json()[‘data‘][‘html‘])
    datas = v_source(‘.list_ul .list_li‘)
    for data in datas:
        print pq(data)(‘.WB_face a img‘).attr(‘src‘)
        print pq(data)(‘.WB_from‘).text(), pq(data).find(‘.WB_text‘).text() #pq(data)(‘.WB_text‘).find(‘a‘).text(),

if __name__ == ‘__main__‘:
    for page in xrange(1,5):
        save(page)

;)

时间: 2024-08-07 23:04:36

Pyquery的安装的相关文章

安装pyquery

1.在电脑上安装cygwin(首次安装一路向下) 2.再次安装,选择full 模式,选择以下插件 2.安装完后,安装插件 python ez_setup.py  输入which python which easy_install # 显示如下:需要修改下C:\cygwin\home\dell\.bash_profile文件,增加 export PATH=/usr/local/bin:/usr/bin alias ls='/bin/ls --color'alias clear='/cygdrive

windows下python安装pyquery

安装pyquery之前首先要明确一点,easyinstall 是一款python包管理器,类似于node的npm,用于安装python的扩展包,它安装的包是以*.egg的方式. 要安装pq需要经历以下步骤: 1:下载easyinstall 官网 设置环境变量,将python目录加入path,在cmd中切换到py的目录 python ez_setup.py 等待下载并安装setuptools 2:设置easy_install环境变量 将C:\Python27\Scripts加入环境变量(每次设置环

【转】CentOS 6.5安装pyspider过程记录

原文地址:http://blog.sina.com.cn/s/blog_48c95a190102wczx.html 1.根据pyspider官方推荐的安装方法,使用pip命令直接安装pyspider # sudo pip install pyspider Installing collected packages: click, itsdangerous, Werkzeug, Flask, chardet, cssselect, lxml, pyquery, ordereddict, backp

安装解析库

背景说明 抓取网页代码后,下一步是从网页中获取信息. 提取信息的方法有很多,可以使用正则表达式,但是写起来比较繁琐.也可以使用强大的解析库. 此外,还有非常强大的解析方法,比如Xpath解析和CSS选择器解析等. 环境说明 [[email protected] Python-3.6.6]# cat /etc/redhat-release Red Hat Enterprise Linux Server release 7.4 (Maipo) [[email protected] Python-3.

Python3网络爬虫实战-3、数据库的安装:MySQL、MongoDB、Redis

抓取下网页代码之后,下一步就是从网页中提取信息,提取信息的方式有多种多样,可以使用正则来提取,但是写起来会相对比较繁琐.在这里还有许多强大的解析库,如 LXML.BeautifulSoup.PyQuery 等等,提供了非常强大的解析方法,如 XPath 解析.CSS 选择器解析等等,利用它们我们可以高效便捷地从从网页中提取出有效信息. 本节我们就来介绍一下这些库的安装过程. 1.2.1 LXML的安装 LXML 是 Python 的一个解析库,支持 HTML 和 XML 的解析,支持 XPath

Python 3网络爬虫开发实战.pdf(崔庆才著)

内容简介  · · · · · · 本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib.requests.正则表达式.Beautiful Soup.XPath.pyquery.数据存储.Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架.Scrapy框架和分布式爬虫. 本书适合Python程序员阅读. 作者简介  · · · · · · 崔庆才 北京航空航天大学硕士,静觅博客(https:/

Selenium爬取淘宝商品概要入mongodb

准备: 1.安装Selenium:终端输入 pip install selenium 2.安装下载Chromedriver:解压后放在…\Google\Chrome\Application\:如果是Mac,可放入/usr/locl/bin,并将此目录放入环境变量 3.安装pyquery:终端输入 pip install pyquery 4.安装pymongo:终端输入 pip install pymongo 5.安装MongoDB的PyCharm插件:Preferences——Plugins——

pyquery 安装

取得网页源代码,导入pyquery库 pip3 install pyquery 如果报错的话:python安装pyquery报错error: 'libxml/xmlversion.h' file not found xcode-select --install sudo C_INCLUDE_PATH=/Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.9.sdk/

【Python爬虫】安装 pyQuery 遇到的坑 Could not find function xmlCheckVersion in library libxml2. Is libxml2 installed?

windows 64位操作系统下,用 Python 抓取网页,并用 pyQuery 解析网页 pyQuery是jQuery在python中的实现,能够以jQuery的语法来操作解析HTML文档,十分方便.使用前需要安装,easy_install pyquery即可,或者Ubuntu下详情参考:http://blog.csdn.net/zhaoyl03/article/details/8631645 但是用pip命令安装pyquey的时候,报错了 pip install pyquery 提示需要先