如何部署Scrapy 到Scrapyd上?

安装上传工具

1、上传工具

scrapyd-client

2、安装方法:

pip install scrapyd-client

3、上传方法:

python d:\Python27\Scripts\scrapyd-deploy target -p project

注:

target -- 主机地址,如localhost;

project -- 工程名,如stock_uc;

4、前提:

①假设python安装位置d:\Python27\;

②需进入工程目录下执行上传命令;

③可选参数:

--version r03,即:

python d:\Python27\Scripts\scrapyd-deploy target -p project --version r03

安装调度工具curl

1、Linux系统

一般情况下Linux系统自带curl工具,如果没有请百度安装方法;

2、Windows系统

1、下载地址:

链接:http://pan.baidu.com/s/1mgy9zVq

密码:4lqh

2、安装方法:

1)解压下载的文件夹,比如解压后的位置E:\bin-curl

2)添加解压后的文件夹路径到环境变量Path中,比如:   D:\Python27\;D:\Python27\Scripts\;E:\bin-curl\;***

3)重启电脑是环境变量生效;

4)测试,运行:curl --help 查看帮助信息;

调度爬虫

1、添加版本信息

curl http://localhost:6800/addversion.json -F project=myproject -F       version=r23 -F [email protected]

2、调度spider执行

curl http://localhost:6800/schedule.json -d project=myproject -d    spider=somespider

3、取消spider的执行

curl http://localhost:6800/cancel.json -d project=myproject -d      job=6487ec79947edab326d6db28a2d8651

4、列出工程

curl http://localhost:6800/listprojects.json

5、如何启动scrapyd,以及如何把一个现有的工程部署到scrapyd上面:

第一步:输入scrapyd,敲击enter,等待:

第二步:在这个服务器上部署工程,具体方法前面已经提到过

第三步:调度spider:

第四步:取消

第五步:列出工程

总结

1,能正确安装scrapyd-client;

2,能够正确安装curl;

3,学会project的上传和spider的调度;

文章来源:麦子学院

原文链接:http://www.maiziedu.com/wiki/crawler/deploy/

时间: 2024-10-06 13:21:45

如何部署Scrapy 到Scrapyd上?的相关文章

五十一 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目

scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目 下载地址:https://github.com/scrapy/scrapyd 建议安装 pip3 install scrapyd 首先安装scrapyd模块,安装后在Python的安装目录下的Scripts文件夹里会生成scrapyd.exe启动文件,如果这个文件存在说明安装成功,我们就可以执行命令了 启动scrapyd服务 在命令输入:scrapyd 如图说明启动成功,关闭或者退出命令窗口,因为我们正真的使用是

scrapy-redis(七):部署scrapy

一般我们写好scrapy爬虫,如果需要启动的话,需要进入scrapy项目的根目录,然后运行以下命令: scrapy crawl {spidername} 这样我们就可以在终端查看到爬虫信息了.但爬虫运行状态还需要给上级领导看,或者自己有空的时候就看看,总不可能想看的时候就登录服务器. 下面就给大家介绍scrapy官方推荐的部署爬虫项目的方法. 需要安装scrapyd和scrapyd-client 对于scrapyd的安装,极力建议大家不要使用pip安装,而是直接从github去下载,然后使用se

log4j部署在hibernate项目上

形式上: 先加入两个包 log4j-1.2.17.jar  slf4j-log4j12-1.5.8.jar,然后再加上一个log4j的配置文件,log4j.properties,这个配置文件的样例可以在hibernate包里的 project/etc/下找到 如何理解? hibernate包lib/required下有一个slf4j-api-1.5.8.jar是一个日志系统的接口, 上面的 log4j-1.2.17.jar 是一种实现,但是又不是完全吻合的,所以有了slf4j-log4j12-1

请求部署在 IIS7.5 上的 REST 服务的 Put/Post/Delete 操作发生 HTTP Error 405.0 - Method Not Allowed 错误之解决

背景 请求部署在 IIS7.5 上的 REST 服务的 Put/POST/DELETE 操作发生 HTTP Error 405.0 - Method Not Allowed 错误. Issue 解决 在 WebAPI 应用的 Web.config 中加入如下设置: <system.webServer> <modules> <remove name="WebDAVModule" /> </modules> <handlers>

用户 &#39;IIS APPPOOL\**&#39; 登录失败的解决方案(项目部署到本地IIS上打开网页出现报错)

为开发方便-将项目部署到本地IIS上打开网页出现报错 1.打开IIS管理 2.点击应用池 3.找到你部署的网站名,右键“高级设置”——>“进程模型”——>“标识”修改为localsystem,点击“确定”. 步骤见下截图: 用户 'IIS APPPOOL\**' 登录失败的解决方案(项目部署到本地IIS上打开网页出现报错)

XML文档部署到Tomcat服务器上总是加载出错

config.xnl 起初文档路径是在src/Dao/config.xml 在Dao目录下BaseDao类中,解析config.xml文件路径 path="/Dao/config.xml",似乎正常,可运行Tomcat总是报错,系统找不到指定文件路径 我又将其放在src/WEB-INFO等文件根目录下,依然显示系统找不到指定文件路径.百度一番,各种建议均无效后,花两小时调试后,总结两种方法 第一种:通过url可以直接请求到服务器资源,那么就将config.xml文件放在Web根目录下,

给新手--安装tomcat后用户名和密码设置以及项目怎么部署在tomcat服务器上

安装后tomcat服务器后,登陆首先就是让输入用户名和密码,可是我们在安装tomcat的过程中好像没有让设置用户名和密码,这时候可能有人就抓狂了,还有的人是突然忘记了用户名和密码,对于出现这种情况该怎么去解决呢? 不慌,tomcat安装的过程中是没有让用户设置用户名和密码,因为这个工作是需要用户自己在配置文件中自己书写的.过程如下: 以我安装tomcat的目录为例  D:\Program Files\apache-tomcat-6.0.35 进入该目录找到conf文件下,找到tomcat-use

Java Project部署到Tomcat服务器上

所有的JAVA程序员,在编写WEB程序时,一般都通过工具如 MyEclipse,编写一个WEB Project,通过工具让这个WEB程序和Tomcat关联.其实在我们可以通过JAVA程序部署到Tomcat服务器上,需要我们开始时手动去修改.     在我们创建一个Java Project时,就要注意WEB程序在Tomcat上的结构,所有需要我们手动的把Java Project去修改成WEB的格式,如下图: 项目需要的包导入到WEB-INF下的lib中. 然后就是需要在tomcat中去配置了.需要

使用java service wrapper将项目部署到linux服务器上

最近有需求是将java项目部署到linux服务器上作为服务端程序,最后经过测试成功.本着分享精神将总结出来的路子分享给大家,如果不明白的地方可以在下边留言,谢谢. 将java项目部署到linux服务器 1.      首先从官网下载http://wrapper.tanukisoftware.com/doc/english/download.jsp,注意下载的文件为Community列中的(PS:其他版本需要序列号) 2.      将写好的java项目打成jar包,待用 3.      将下载好