【Python3 爬虫】05_安装Scrapy

Scrapy简介

Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。框架的力量，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片，非常之方便。

Scrapy Engine(引擎) : 负责 Spider 、 ItemPipeline 、 Downloader 、 Scheduler 中间的通讯，信号、数据传递等。
Scheduler(调度器) : 它负责接受 引擎 发送过来的Request请求，并按照一定的方式进行整理排列，入队，当 引擎 需要时，交还给 引擎 。
Downloader（下载器） ：负责下载 Scrapy Engine(引擎) 发送的所有Requests请求，并将其获取到的Responses交还给 Scrapy Engine(引擎) ，由 引擎 交给 Spider 来处理，
Spider（爬虫） ：它负责处理所有Responses,从中分析提取数据，获取Item字段需要的数据，并将需要跟进的URL提交给 引擎 ，再次进入 Scheduler(调度器)，
Item Pipeline(管道) ：它负责处理 Spider 中获取到的Item，并进行进行后期处理（详细分析、过滤、存储等）的地方.
Downloader Middlewares（下载中间件） ：你可以当作是一个可以自定义扩展下载功能的组件。
Spider Middlewares（Spider中间件） ：你可以理解为是一个可以自定扩展和操作 引擎 和 Spider 中间 通信 的功能组件（比如进入 Spider 的Responses;和从 Spider 出去的Requests）

安装Scrapy

系统配置 win10 64位企业版

直接使用命令安装Scrapy

pip install Scrapy

RuntimeError: cryptography requires setuptools 18.5 or newer, please upgrade to a newer version of setuptools

问题解决：

下载setuptools并安装

接着再次运行pip install Scrapy,再次报错:

error: Microsoft Visual C++ 10.0 is required. Get it with "Microsoft Windows SDK 7.1": www.microsoft.com/download/details.aspx?id=8279

error: Microsoft Visual C++ 10.0 is required.

解决问题：

根据报错提供的网址，点击进去直接下载文件并安装

原文地址：https://www.cnblogs.com/OliverQin/p/8652593.html

时间： 2024-11-04 04:07:06

【Python3 爬虫】05_安装Scrapy的相关文章

win7中python3.4下安装scrapy爬虫框架（亲测可用）

貌似最新的scrapy已经支持python3,但是错误挺多的,以下为在win7中的安装步骤: 1.首先需要安装Scrapy的依赖包,包括parsel, w3lib, cryptography, pyOpenSSL,twisted,lxml 其中,twisted和lxml的安装包可以在http://www.lfd.uci.edu/~gohlke/pythonlibs/下载对应的安装包(我的是win64,python34) pip install Twisted-17.1.0-cp34-cp34m-

如何解决python3.5.2安装scrapy的无法查找到vsvarall的问题

最近在使用python的Scrapy爬虫框架进行相应爬虫项目的开发和学些.但是在Windows环境下安装Scrapy的运行环境时,一直vsvarall.bat无法找到(is required < Unable to find vcvarsall.bat> ).在网上找了各种各样的方法,尝试后都无法解决上述问题,后来通过参考一些其它的解决方法,并结合具体问题分析后,现将自己的解决办法整理如下: 1.出现上述报错,首先是因为Windows环境下为安装MicrosoftVisual Studio

python3.6成功安装scrapy

本文基于环境:win10(64)+python3.6(64) 第一次直接pip install scrapy,安装出错,错误提示 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools 于是,我登陆网站http://landinghub.vi

Python3安装scrapy教程

本人经过一系列令人想要砸电脑的试验后,我总于找到了Python3下正确安装scrapy的方法,第一步,来这里下载适合你的lxml 下载好你的*.whl后,在该文件目录下输入以下命令 successfully install 啦啦啦.有不会记得留言哦!!

win7安装python3.6.1及scrapy

---恢复内容开始--- 第一篇博客,记录自己自学python的过程及问题. 首先下载python3.6.1及所需资料百度云:https://pan.baidu.com/s/1geOEp6z 密码:1fuw 文件列表如下: 先安装 python-3.6.1-amd64.exe. 安装完成后进入cmd,输入python 安装成功. 下面安装scrapy依赖插件. 通过命令:pip install xxxx 安装以下文件安装lxml-3.7.3-cp36-cp36m-win_amd64.whl

Python爬虫进阶之Scrapy框架安装配置

Python爬虫进阶之Scrapy框架安装配置初级的爬虫我们利用urllib和urllib2库以及正则表达式就可以完成了,不过还有更加强大的工具,爬虫框架Scrapy,这安装过程也是煞费苦心哪,在此整理如下. Windows 平台: 我的系统是 Win7,首先,你要有Python,我用的是2.7.7版本,Python3相仿,只是一些源文件不同. 官网文档:http://doc.scrapy.org/en/latest/intro/install.html,最权威哒,下面是我的亲身体验过程. 1

【转载】python3安装scrapy之windows32位爬坑

python3安装scrapy之windows32位爬坑原创 2016年11月06日 01:38:08 标签: scrapy / windows / python / 开源框架 / 网络爬虫早就听说scrapy不支持python3,而scrapy作为一款优秀的开源框架,不在新的python上集成一下实在可惜.最近刚好打算开始学习网络爬虫,网上又有那么多教程,so今天就来爬一下这个坑. 首先当然是安装一下python,官网可以直接安装最新的3.5.2.安装完成以后,可以成功python后在cm

芝麻HTTP：Python爬虫进阶之Scrapy框架安装配置

初级的爬虫我们利用urllib和urllib2库以及正则表达式就可以完成了,不过还有更加强大的工具,爬虫框架Scrapy,这安装过程也是煞费苦心哪,在此整理如下. Windows 平台: 我的系统是 Win7,首先,你要有Python,我用的是2.7.7版本,Python3相仿,只是一些源文件不同. 官网文档:http://doc.scrapy.org/en/latest/intro/install.html,最权威哒,下面是我的亲身体验过程. 1.安装Python 安装过程我就不多说啦,我的电

Python3.5下安装&测试Scrapy

1.引言 Scrapy框架结构清晰,基于twisted的异步架构可以充分利用计算机资源,是做爬虫必备基础,本文将对Scrapy的安装作介绍. 2.安装lxml 2.1 下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 选择对应python3.5的lxml库 2.2 如果pip的版本过低,先升级pip: python -m pip install -U pip 2.3 安装lxml库(先将下载的库文件copy到python的安装目录