Python实用工具包Scrapy安装教程

   对于想用每个想用Python开发网络爬虫的开发者来说,Scrapy无疑是一个极好的开源工具。今天安装之后觉得Scrapy的安装确实不易啊。所以在此博文一篇,往后来着少走弯路。

废话不多说了,如果你还不知道Scrapy是何物,可登陆在其官网http://scrapy.org/一览究竟,在此不再赘述。

scrapy在国内目前使用的人比较少,除了他比较新以外,还在于他本身还有很多弊端,比如:需要的支持包比较多,这些支持包相互之间的依赖关系,导致人们在安装他的时候各种吐血,而且吐血了还不一定又正确的结果。本人今天就吐学半天,终于守得云开见明月。

  本次安装使用的系统环境是windows 7。以下给出具体步骤。我想如果照做一定能够成功哦。

1.安装python2.7.这里选择的是python2.7,为什么选择这个版本,首先,scrapy官网上明确写出:requirements:Python 2.5, 2.6, 2.7 (3.x is not yet supported), 即目前只支持python2.5,2.6,2.7.3以上版本的python还不支持。ActiveState 制作的ActivePython 是专门针对 Windows 的 Python 套件,它包含了一个完整的 Python 发布、一个适用于 Python 编程的 IDE 以及一些 Python 的 Windows 扩展,提供了全部的访问 WindowsAPIs 的服务,以及 Windows 注册表的注册信息。 虽然ActivePython 不是开源软件,但它可以自由下载。故此本人推荐安装ActivePython,下载地址,http://www.activestate.com/Products/ActivePython/

本人在此为初学者推荐你一些较好的学习资料,希望对大家有所帮助,网络资源共享,大家进步才会快些。

《Dive Into Python》不错的一本教程http://woodpecker.org.cn/diveintopython/

另外推荐一个Python视频学习网站http://www.csvt.net/video#,这些对于初学者还是很不错的。

还有就是一个不错的python开发环境PyCharm,在http://www.jetbrains.com/pycharm/可以了解一下PyCharm的相关概况,下载地址http://www.jetbrains.com/pycharm/download/

Pycharm的注册机我已经上传到我的空间,欢迎下载。地址:http://download.csdn.net/detail/wukaibo1986/4751339

选择你觉得喜欢的IDE,之后就开始今天的安装了,安装之后首先设置环境变量,具体步骤如下:我的电脑-》高级环境变量里,

将C:\Python27加入到环境变量。

到这里安装python结束,在cmd模式下输入执行python,产生下面的类似的画面表示python安装成功.

2.按照python官网准备安装twisted.

    twisted的安装方法,安装twisted先需要zope.interface,PyopenSSL,这2个第三方包。而通过twisted官网上,我们可以看见下载的都是zope.interface,PyopenSSL等都是egg文件,那么在这里我们就先需要setuptools工具。

1.在这里下载:http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe

双击这个图标执行。那么执行后在python根目录下的scripts文件夹里就会有easy_install.py等文件了,都带有easy_install字眼。easy_install工具安装完成。

2.zope_interface的安装.通过twised的下载页面:http://twistedmatrix.com/trac/wiki/Downloads

点击进行zope.interface,进入到http://pypi.python.org/pypi/zope.interface#download , 选择符合当前环境的可供下载的egg,

这里我们选择,下载,这样的一个文件,这时候把这个egg文件拷贝进入刚才我们说道的python根目录下的scripts目录,同easy_installs等文件一个目录位置。然后进入cmd模式,在cmd模式下进入这个script目录,执行easy_install.py  egg文件名,执行安装这个egg文件。

    这里检查zope.interface是否安装成功,,在python环境中执行import zope.interface,加入不报错误,那么说明zope.interface安装正确。

3.同上,执行安装PyOpenSSL.在http://pypi.python.org/pypi/pyOpenSSL 这里,有这些版本的pyOpenSSL供你选择。在这里我们选择安装pyOpenSSL,先将下载到的pyOpenSSL,拷贝到scripts文件夹中,然后进入到cmd模式下,在cmd模式中进入到对应的scripts文件夹下,执行easy_install.exe pyOpenSSL-0.12-py2.6-win-amd64.egg ,进行安装。效果图为

在执行验证是否安装成功:在python环境中,执行import OpenSSL,查看是否能正常执行在·导入。加入不报一场或错误,则表示安装正确。

    4.安装twisted.回到twisted的下载链接:http://twistedmatrix.com/trac/wiki/Downloads,因为我们这里需要的是python2.6的对应的twisted版本。这里我们选择了第二个的exe版本。下载后双击就能安装.安装过程是自动执行的。所以也就不做过多说明,又可能发生的错误是版本对应不一致,是因为你没有选择当前和你python对应的版本的twisted.到这里twisted安装完成,但是具体是否还有问题,我们不能急于的下结论,因为当前的支持包已经有4种了,分别是setuptools,zope.interface,pyOpenSSL,twisted,而在twisted中不是还有一个PyCrypto 2.0.1 for Python 2.5 吗?我们并没有理他,我在这里因为是使用了python2.6版本,所以先暂时不理他,但是能完全不理他吗?因为我们并不确定这个包起到的作用,或者,在python.26里,或者在对应于python26版本的twisted是否存在PyCrypto 2.0.1.或者是替代他的作用的包。所以只能说暂时,到时候在实际开发过程中如果有任何问题在考虑之。

  3.按照scrapy官网,安装lxml.在scrapy 的http://doc.scrapy.org/intro/install.html#intro-install最下面的一段又关windows安装的情况。到这里点击关于lxml的选项,进入:http://users.skynet.be/sbi/libxml-python/ ,在这里我们选择了:第二项,又libxml for python2.6等关键字.安装后在python环境中执行import libxml2,如果未报错,表示正确。

  4.安装scrapy.进入scrapy 官网:http://scrapy.org/download/ 这个链接,点击Scrapy 0.12 on PyPI ,注意他后面可是有括号的,(include windows installers),表示点击这里也可以在windows下安装的。进入http://pypi.python.org/pypi/Scrapy 这个页面,点击这里关于exe的格式,进行下载。下载后直接进行双击就可以执行了。这个时候查看是否在python目录下的第三方目录中(即site-package)中是否有关于scrapy的文件夹了,然后在cmd模式中任意目录输入scrapy,这时候提示出错误,是需要把python根目录下的script目录设置到环境变量中。,然后重新打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功.

但是本人当时发现一个问题在使用SCRAPY SHELL命令时候发现不能输出,重新查找安装文件,发现需要lxml

经过网友协助在网上找到下载http://pypi.python.org/pypi/lxml/2.3#downloads,安装 。重新启动测试,终于搞定了。

至此Scrapy的安装全部介绍完毕,希望对大家有用。

本次安装,主要参考http://www.cnblogs.com/CLTANG/archive/2011/07/05/2098531.html但是在安装的过程之火也遇到了不少自己特有的问题,在此解答希望能对大家有所帮助。

原文地址:http://blog.csdn.net/wukaibo1986/article/details/8167590

时间: 2024-10-09 14:27:40

Python实用工具包Scrapy安装教程的相关文章

Python爬虫 01 PyCharm 安装教程(Windows)

简介 哥们今天开始写写python爬虫相关的博客了,废话不多说,直接开干吧! 正所谓工欲善其事必先利其器,在开始进行爬虫之前,下载安装pychrom是十分必要的,代码的编写和运行都需要在pycharm中进行. 下面是pycharm的安装教程(Windows),基于其他平台的安装教程,可自行百度查找,按照教程自行安装即可. PyCharm 是一款功能强大的 Python 编辑器,具有跨平台性,鉴于目前最新版 PyCharm 使用教程较少,为了节约时间,来介绍一下 PyCharm 在 Windows

PYTHON PIP和kivy安装教程

我们安装pip.我们同样需要在Python的官网上去下载 下载地址:https://pypi.python.org/pypi/pip 下载完成之后,解压到一个文件夹,用CMD控制台进入解压目录,输入: python setup.py install 安装好之后,我们直接在命令行输入pip,同样会显示'pip'不是内部命令,也不是可运行的程序.因为我们还没有添加环境变量. 然后安装kivy 同样安装地址和官方教程地址:https://kivy.org/docs/installation/insta

Windows10 python 3.5 Scrapy 安装配置

学习和使用python也有2年有余,一直在cnblogs里面寻求各种问题的解决方案,还未真正的记录下自己学习.思索的点点滴滴:从今天开始将自己的学习或者实践分享出来,其目的有二:1.监督自己不断学习,不断总结:2.将自己知道的分享出来,为后来者贡献一点儿绵薄之力.言归正传,今天首记录下Scrapy的安装和配置. 正如标题所示:我目前的操作系统和python软件分别是:windows 10 和 python 3.5,所以介绍的是基于以上环境的scrapy安装. 1.安装Twisted a.首先下载

Pycharn中的scrapy安装教程

在利用pycharm安装scrapy包是遇到了挺多的问题.在折腾了差不多折腾了两个小时之后总算是安装好了.期间各种谷歌和百度,发现所有的教程都是利用命令行窗口安装的.发现安装scrapy需要的包真是多的要死啊.没有专门针对pycharm安装的.因此这里将自己的安装经验分享一下,希望能帮助一些pythoner少走一些弯路(废话到此为止,下面正题..) 首先呢,你肯定要安装好了pycharm了,然后就是利用伟大的pycharm的自动查找安装第三方包,pycharm可以帮你找到大多数的第三方包,不需要

Python爬虫框架Scrapy安装使用步骤

一.爬虫框架Scarpy简介Scrapy 是一个快速的高层次的屏幕抓取和网页爬虫框架,爬取网站,从网站页面得到结构化的数据,它有着广泛的用途,从数据挖掘到监测和自动测试,Scrapy完全用Python实现,完全开源,代码托管在Github上,可运行在Linux,Windows,Mac和BSD平台上,基于Twisted的异步网络库来处理网络通讯,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片. 二.Scrapy安装指南 我们的安装步骤假设你已经安装一下内容:<1>

Python实用环境pyenv搭建教程

实验系统:kubuntu-15.10-desktop-amd64 关于pyenv的介绍:一般在操作系统中我们会安装多个Python版本,在*nix系统中一般默认就自带了Python2与Python3两个版本,所以在进行Python版本切换时会比较麻烦,pyenv就提供了一种简单的方式.pyenv是一个能简易地在多个Python版本中进行切换的工具,它简单而优雅. pyenv有以下功能: 进行全局的Python版本切换 为单个项目提供对应的Python版本 使用环境变量能让你重写Python版本

最简单实用的MongoDB安装教程:在CentOS中使用 yum 安装MongoDB及服务器端配置详解

一.准备工作: 运行yum命令查看MongoDB的包信息 [[email protected] ~]# yum info mongo-10gen (提示没有相关匹配的信息,) 说明你的centos系统中的yum源不包含MongoDB的相关资源,所以要在使用yum命令安装MongoDB前需要增加yum源,也就是在 /etc/yum.repos.d/目录中增加 *.repo yum源配置文件,以下分别是针对centos 64位和32位不同的系统的MongoDB yum 源配置内容: 我们这里就将该文

MyEclipse10或者eclipse中配置开发Python的Pydev插件安装教程

注意使用LiClipse的用户 PyDev已经预装在LiClipse中,所以可以跳过这一步(请注意,如果使用LiClipse,PyDev不能单独安装或更新,因为它必须始终作为一个整体更新). 必需品 PyDev需要Java 8和Eclipse 4.6(Neon)才能运行,并且仅支持Python 2.6. 如果没有Java 8,更新过程可能会成功,但PyDev将不会在目标安装中显示.在尝试安装PyDev之前,请仔细检查一下在"安装详细信息>配置 "中是否使用Java 8 vm .

(Windows)Python第三方库手动安装教程(以lxml库为例)

案例前提:已安装Python 已安装pip 1.进入官网https://www.lfd.uci.edu/~gohlke/pythonlibs/,搜索lxml库,下载到本地(放到Python目录下的Scripts文件中) 2.打开cmd,键入pip install wheel,先安装wheel库了才能安装.whl文件 ??? 3.此处根据提示,更新PIP(可不更新,更新后可不必考虑库的版本直接安装最新版本而已) ??? 4.命令行键入pip3 install lxml-4.4.0-cp37-cp3