0)安装 scrapy
pip install scrapy
1)创建一个项目
scrapy startproject dmoz
2)采集
scrapy shell #交换学习模式
scrapy crawl dmoz #自动采集模式
3)解析
response.xpath("/html/head/title") response.css("title")
4)提取
response.css("title").extract() #全部提取 response.css("title").re(‘(\w+)‘) #根据正则提取
时间: 2024-12-16 09:57:56