Scrapy安转遇到问题

最近尝试使用Scrapy进行数据抓取,并尝试在windows7 64位系统上安装scrapy,下面总结记录遇到两个问题和解决方法:

scrapy官网的地址为:http://scrapy.org/

1、首先按照官网的说明,直接pip安装scrapy,报以下错误,提示缺少VC++9.0,报错信息有给出具体的说明和解决方法。

>>pip install scrapy

error: Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

解决方法:直接点击下载VCForPython27.msi,也直接访问下面的连接https://www.microsoft.com/en-us/download/details.aspx?id=44266

2、下载并安装VCForPython27.msi,然后再运行pip install scrapy,再次报错,提示找不到libxml2库。

>>pip install scrapy

c:\users\zjn3645\appdata\local\temp\xmlXPathInit7hkp2z.c(1) : fatal error C1083: Cannot open include file: ‘libxml/xpath.h‘: No such file or directory

*********************************************************************************

Could not find function xmlCheckVersion in library libxml2. Is libxml2 installed?

*********************************************************************************

error: command ‘C:\\Users\\zjn3645\\AppData\\Local\\Programs\\Common\\Microsoft\\Visual C++ for Python\\9.0\\VC\\Bin\\cl.exe‘ failed with exit status 2

解决方法:

使用easy_install安装lxml,然后再次安装pip install scrapy,成功~

>>easy_install lxml

 

3、scrapy安装完成,运行官网首页的样例报错,原因是缺少pywin32

>>scrapy runspider myspider.py

exceptions.ImportError: No module named win32api

2016-03-09 10:17:49 [twisted] CRITICAL:

解决方法:按照官方文档的说明安装

Install pywin32 from https://sourceforge.net/projects/pywin32/files/pywin32/

这里有详细的说明http://doc.scrapy.org/en/latest/intro/install.html#intro-install-platform-notes

pywin32有32位和64位版本,

对于64位的windows 7,如果python环境变量已经正确安装,pywin32安装的时候仍然报找不到python的错误,尝试pywin32的32位版本。

总结:在安装和使用新的工具之前一定要先看看官方文档的说明,搞清楚安装和使用的前提条件!

4、关闭代理

默认使用代理,有些网页使用本地代理无法访问!

2016-03-09 15:18:21 [scrapy] DEBUG: Telnet console listening on 127.0.0.1:6023

2016-03-09 15:18:21 [scrapy] DEBUG: Crawled (403) <GET http://xxx.com.cn/xxx.html>

(referer: None)

2016-03-09 15:18:21 [scrapy] DEBUG: Ignoring response <403 http://xxx.com.cn/xxx.html>: HTTP status code is not handled or not allowed

关闭代理

修改settings.py如下

DOWNLOADER_MIDDLEWARES = {

    ‘scrapy.downloadermiddlewares.useragent.UserAgentMiddleware‘: None,

}

python scrapy 安装 lxml 报 ERROR: ‘xslt-config‘ 不是内部或外部命令,也不是可运行的程序的解决办法。

1  解决办法

手动安装 lxml包

http://pypi.python.org/simple/lxml/,下载win7 x64的(注意下载对应你系统版本):

https://pypi.python.org/packages/2.7/l/lxml/lxml-2.2.8.win-amd64-py2.7.exe#md5=cfcf7f07a5016a5934271cddde4bbcbe

然后重新打开cmd去pip install Scrapy,解决了此xml的问题了

时间: 2024-07-28 21:55:36

Scrapy安转遇到问题的相关文章

Anaconda 科学计算环境

相信大多数 python 的初学者们都曾为开发环境问题折腾了很久,包管理和 python 不同版本的问题,特别是 window 环境安装个 scrapy 各种报错 ,使用 Anaconda 可以很好的解决一些不必要的学习成本. Anaconda 概述 Anaconda 是一个用于科学计算的 python发行版,支持 Linux, Mac, Windows系统,提供了包管理与虚拟环境管理的功能,可以很方便地解决多版本 python 并存.切换以及各种第三方包安装问题.可以使用 conda 来进行

pip 的简单使用

pip3 install scrapy #安装包 pip3 uninstall scrapy #删除安装包 pip3 search 'packages_name'#搜索包 pip3 list  #列出已经安装的软件包 pip3 --files somepackage #查看安装的包 pip list --outdated #检查那些包需要更新 或者 过期 pip install --upgrade somepackage pip --help   帮助 pip -h 帮助 pip --versi

scrapy模块安及使用

一.Windows安装 Twisted下载及安装 在https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载对应的Twisted的版本文件 在命令行进入到Twisted的目录 执行pip install 加Twisted文件名 执行命令 pip install scrapy 二.Ubuntu安装 下载twisted wget https://files.pythonhosted.org/packages/90/50/4c315ce5d119f67189d181

Scrapy+BeautifulSoup+MongoDB 高性能数据采集方案(Chapter 1st)

运行环境 CentOS7.3 + Python2.7 + Scrapy1.3 + MongoDB3.4 + BeautifulSoup4.6 编程工具 PyCharm + Robomongo + Xshell 请确保你的 python版本为2.7.5以上 版本强烈推荐直接[翻 墙 安 装],简单轻松 yum install gcc libffi-devel python-devel openssl-devel pip install scrapy 如果提示以下错误 AttributeError:

教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神

欢迎加入Python学习交流群:535993938  禁止闲聊 ! 名额有限 ! 非喜勿进 ! 本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力.本文以校花网为例进行爬取,校花网:http://www.xiaohuar.com/,让你体验爬取校花的成就感. Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy用途广泛,可以用于数据挖掘.监测和自动化测试. Scrapy吸引人的地方在于

Windows平台下,Scrapy Installation,安装问题解决

按理说直接:pip install scrapy 就可以成功,但是出现了错误"libxml/xpath.h: No such file or directory" "error:failed with exit status 2" (百度上有很多解决方案而且大多相同,但是都没解决我的问题) 最后还是上官网找解决方法:https://doc.scrapy.org/en/latest/intro/install.html Scrapy is written in pur

安装 Scrapy python抓取工具

重点在于FQ1.安装 pywin32 从http://sourceforge.net/projects/pywin32/ 请确认下载符合您系统的版本(win32或者amd64)2.安装 pip 地址:https://pypi.python.org/pypi/pip#downloads 注意选择tar.gz包,目前最新版本: pip-7.1.0.tar.gz (md5, pgp) 解压安装包,使用CMD进入解压目录,然后使用如下命令进行安装 python setup.py install 添加wi

scrapy基本使用(一)

参考文档:Scrapy入门教程 http://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.html 1. 安装 python3.5 按照官网大写的安不上,要是小写的才能安上 pip install scrapy 理论上如果报错,再看几遍就好了,至少我是这样,可能是网络问题吧. 2. 基础操作 1) 创建项目 这是第一步,因为我们要使用人家搭好的框架,这步就是生成框架. scrapy startproject tutorial 执行成功会

windows下Scrapy爬虫框架

1.   安装python 根据你的需求下载python安装包,安装python(本文基于python27)https://www.python.org/downloads/ 下载完安装默认安装路径,方便后续 在 环境变量---"Path"中加入路径:"C:\Python27;C:\Python27\Scripts;" 在运行中输入"cmd"打开命令窗口,输入"python --version",如果成功显示python版本号