scrapy系列教程二——命令行工具(Command line tools)

1.命令行工具(Command line tools)

Scrapy是通过Scrapy命令行工具进行控制的。这里我们称之为 “Scrapy tool” 以用来和子命令进行区分。 对于子命令,我们称为 “command” 或者 “Scrapy commands”。Scrapy tool 针对不同的目的提供了多个命令,每个命令支持不同的参数和选项。

2.常用命令

官方命令行说明文档 http://scrapy-chs.readthedocs.org/zh_CN/latest/topics/commands.html

  • 查看所有可用的命令 scrapy -h
  • 创建scrapy项目 : scrapy startproject myproject(工程名字)

接下来,进入到项目目录中: cd myproject

项目默认目录结构:

       scrapy.cfg
       myproject/
           __init__.py
          items.py
          pipelines.py
          settings.py
          spiders/
              __init__.py
              spider1.py
              spider2.py
               ...
  • 列出所有可用爬虫 : scrapy list
  • 启动一个爬虫:scrapy crawl <spidername>  其中spidernae是在爬虫文件里声明的

  • scrapy终端 :scrapy shell [url]  这个是常用的,可以验证调试你写的xpath

scrapy终端官方教程 http://scrapy-chs.readthedocs.org/zh_CN/latest/topics/shell.html

时间: 2024-11-13 04:46:19

scrapy系列教程二——命令行工具(Command line tools)的相关文章

MAC 命令行工具(Command Line Tools)安装

不过升级后安装命令行工具(Command Line Tools)时发现官网没有clt的下载安装包了,原来改了,使用命令在线安装. 打开终端,输入命令:xcode-select --install 选择“安装”,然后同意安装协议.

MAC OS 如何安装命令行工具:Command Line Tools

打开终端输入:xcode-select --install 回车 安装好了测试结果:gcc -v 显示如下: xcode-select: note: install requested for command line developer tools apple-1tekiiMac:~ apple-1$ gcc -v Configured with: --prefix=/Applications/Xcode.app/Contents/Developer/usr --with-gxx-includ

scrapy1.0手册--01--命令行工具(Command line tools)

命令行工具(Command line tools) 0.10 新版功能. Scrapy是通过 scrapy 命令行工具进行控制的. 这里我们称之为 "Scrapy tool" 以用来和子命令进行区分. 对于子命令,我们称为 "command" 或者 "Scrapy commands". Scrapy tool 针对不同的目的提供了多个命令,每个命令支持不同的参数和选项. 默认的Scrapy项目结构 在开始对命令行工具以及子命令的探索前,让我们首先

Apache Kafka系列(二) 命令行工具(CLI)

Apache Kafka系列(一) 起步 Apache Kafka系列(二) 命令行工具(CLI) Apache Kafka命令行工具(Command Line Interface,CLI),下文简称CLI. 1. 启动Kafka 启动Kafka需要两步: 1.1. 启动ZooKeeper [[email protected] kafka_2.12-0.11.0.0]# bin/zookeeper-server-start.sh config/zookeeper.properties 1.2.

Phalcon下命令行应用(command line applications)

今天打算在phalcon项目下加入一个定时任务,来发送邮件. 看了官网的例子,配置和运行都少许杂乱,还有个bug,见备注, 我这边主要讲解如何将command line 的配置独立出来,如果初上手的同学,建议先运行官网第一个例子,成功后,再实践一下官网第二个例子,出现报错,就看我备注,然后再看我这如何将配置独立处理. 借鉴思想:主要借鉴Yii框架中,类似功能commands的配置console.php. 第一步:在app下的tasks文件夹下建三个文件: cl_config.php    //直

Xcode Command Line Tools(命令行工具)

OS X 10.9 Mavericks正式发布,免费更新,立即去更新看看效果. 不过升级后安装命令行工具(Command Line Tools)时发现官网没有clt的下载安装包了,原来改了,使用命令在线安装. 打开终端,输入命令:xcode-select --install                                                                                                           

OS X 10.9 Mavericks下如何安装Command Line Tools(命令行工具)

OS X 10.9 Mavericks正式发布,免费更新,立即去更新看看效果. 不过升级后安装命令行工具(Command Line Tools)时发现官网没有clt的下载安装包了,原来改了,使用命令在线安装. 打开终端,输入命令:xcode-select --install 选择“安装”,然后同意安装协议. OS X 10.9 Mavericks下如何安装Command Line Tools(命令行工具)

Scrapy系列教程(1)------命令行工具

默认的Scrapy项目结构 在開始对命令行工具以及子命令的探索前,让我们首先了解一下Scrapy的项目的文件夹结构. 尽管能够被改动,但全部的Scrapy项目默认有类似于下边的文件结构: scrapy.cfg myproject/ __init__.py items.py pipelines.py settings.py spiders/ __init__.py spider1.py spider2.py ... scrapy.cfg 存放的文件夹被觉得是 项目的根文件夹 .该文件里包括pyth

JDK的命令行工具系列 (二) javap、jinfo、jmap

javap: 反编译工具, 可用来查看java编译器生成的字节码 参数摘要: -help 帮助 -l 输出行和变量的表 -public 只输出public方法和域 -protected 只输出public和protected类和成员 -package 只输出包,public和protected类和成员,这是默认的 -p -private 输出所有类和成员 -s 输出内部类型签名 -c 输出分解后的代码,例如,类中每一个方法内,包含java字节码的指令 -verbose 输出栈大小,方法参数的个数