jdango+scrapy结合使用并爬取数据入库

1. 创建django项目，并编写models.py,启动django项目

2. 配置Django嵌入
　　Django项目根目录下创建Scrapy项目（这是scrapy-djangoitem所需要的配置）
　　配置Django嵌入，在Scrapy的settings.py中加入以下代码：

import os
import sys
sys.path.append(os.path.dirname(os.path.abspath(‘.‘)))
os.environ[‘DJANGO_SETTINGS_MODULE‘] = ‘子app.settings‘
# 手动初始化Django：
import django
django.setup()

3.编写爬虫

4.item.py中引入Django模型类

import scrapy

from scrapy_djangoitem import DjangoItem
from 子app import models
class TalksItem(DjangoItem):
    django_model = models.表名

5.pipelines.py中调用save()

class TalksPipeline(object):
    def process_item(self, item, spider):
        print(‘打开数据库‘)
        item.save() # 数据将会自动添加到指定的表
        print(‘关闭数据库‘)
        return item

6.启动爬虫：scrapy crawl 爬虫名

7.刷新admin后台，此时数据已经入库了！

开不开心！

原文地址：https://www.cnblogs.com/kitshenqing/p/11059636.html

时间： 2024-10-07 19:25:13

jdango+scrapy结合使用并爬取数据入库的相关文章

Scrapy框架——使用CrawlSpider爬取数据

引言本篇介绍Crawlspider,相比于Spider,Crawlspider更适用于批量爬取网页 Crawlspider Crawlspider适用于对网站爬取批量网页,相对比Spider类,CrawSpider主要使用规则(rules)来提取链接,通过定义一组规则为跟踪链接提供了遍历的机制. Crawlspider 的强大体现在自动爬取页面所有符合规则的链接并深入下去! 全站数据爬取编码流程新建一个工程 cd 工程创建爬虫文件: scrapy genspider -t crawl s

Python 爬取数据入库mysql

1 # -*- enconding:etf-8 -*- 2 import pymysql 3 import os 4 import time 5 import re 6 serveraddr="localhost" 7 user="root" 8 password="123456" 9 databaseName="test" 10 filename="./data/UNCL.csv" 11 12 def c

【个人】爬虫实践，利用xpath方式爬取数据之爬取虾米音乐排行榜

实验网站:虾米音乐排行榜网站地址:http://www.xiami.com/chart 难度系数:★☆☆☆☆ 依赖库:request.lxml的etree (安装lxml:pip install lxml) IDEA开发工具:PyCharm_2017.3 Python版本:Python3 期望结果:爬取出排行版歌名以及对应歌手运行效果图: 音乐排行榜: 爬取数据结果图: 像这种简单的爬取就没必要使用Scrapy框架进行处理,是在有点大材小用,不过如果你刚开始学Scrapy的话,拿这些简单的练

爬虫5 scrapy框架2 全站爬取cnblogs, scarpy请求传参, 提高爬取效率, 下载中间件, 集成selenium, fake-useragent, 去重源码分析, 布隆过滤器, 分布式爬虫, java等语言概念补充, bilibili爬视频参考

1 全站爬取cnblogs # 1 scrapy startproject cnblogs_crawl # 2 scrapy genspider cnblogs www.cnblogs.com 示例: # cnblogs_crawl/cnblogs_crawl/spiders/cnblogs.py import scrapy from cnblogs_crawl.items import CnblogsCrawlItem from scrapy.http import Request class

jdango+scrapy结合使用并爬取数据入库

jdango+scrapy结合使用并爬取数据入库的相关文章

Scrapy框架——使用CrawlSpider爬取数据

Python 爬取数据入库mysql

【个人】爬虫实践，利用xpath方式爬取数据之爬取虾米音乐排行榜

爬虫5 scrapy框架2 全站爬取cnblogs, scarpy请求传参, 提高爬取效率, 下载中间件, 集成selenium, fake-useragent, 去重源码分析, 布隆过滤器, 分布式爬虫, java等语言概念补充, bilibili爬视频参考

借助Chrome和插件爬取数据

web scraper——简单的爬取数据【二】

scrapy之360图片爬取

scrapy爬虫框架(四)-爬取多个网页

使用HttpClient+Json解析器爬取数据并存入数据库