使用django+mysql+scrapy制作的一个小说网站

小说网站用的程序都是千篇一律的,jieqi + guanguang,无聊时间学习python+django,也做了一个小说网站,下面说一说做这个网站一些过程,

制作这种采集站,最要紧的是要有一个好的采集器,在python的世界里面,爬取网页真是小菜一碟,urllib urllib2 requests 都是神器,不过为了追求程序的稳定性和易用性,我采用了scrapy这个第三方采集库

在windows下安装这个采集库有点麻烦,给大家推荐一个网站 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 这里面有lxml 等在win品台上不好安装的库

采集小说无非就 小说名,作者,分类,介绍,还有各个章节的内容,这个使用scrapy非常容易实现,为了使热门的小说能够更快的采集和更新,我分别做了2个爬虫,一个爬虫从采集站的列表页采集小说,一个爬虫专门用于指定的单本小说的采集,这样,后台设置的热门的主推小说能够在第一时间里采集到,两个爬虫都是每隔3分钟就循环采集一次,使用supervisor保证爬虫24h在线。

  采集内容的过滤,依靠的是xpath和re相互扶助配合,过滤掉采集站的url,和一些与采集站有关的内容,保证采集到的内容是干净的,

django这方面我觉得就没有什么多说的了,应为一个小说站的逻辑是非常简单的

在部署方面使用的是supervisor gunicorn nginx 配合起来还是很快的

还有使用了fabric 进行远程部署,因为小说站基本上都是国外的vps,ssh连接是很慢的

易读中文网 这就是小站,

最悲剧的是买域名的时候没有注意到,这个域名原来是干菠菜的,亏死我了,不知道会不会有收录,哎慢慢等吧!

时间: 2024-08-29 22:48:41

使用django+mysql+scrapy制作的一个小说网站的相关文章

基于Django+Bootstrap框架,设计微型小说网站

一.项目背景: ? 为了回顾关于django的文件上传和分页功能,打算写一个微型的小说网站练练手.花了一个下午的时间,写了个小项目,发现其中其实遇到了许多问题,不过大部分通过debug之后就解决了,其他部分通过阅读了Pagination插件以及Bootstrap-FileInput插件的官方文档. 二.详细设计: ? 省去小说网站的用户模块的功能,小说网站主要的功能就是上传文件,在线阅读小说.针对这两个功能,? 主要用到dajngo内置的Pagination模块,以及选择一个上传文件插件即可.因

用Django+MySQL+Celery+RabbitMQ实现一个分布式测试系统

最近做了一个分布式的测试系统,目前实现了主要的架构和MVP(minimum viable product)版本的基本功能.在架构设计.数据库设计.具体实现等方面,(算是目前我做的架构最复杂的测试系统)还是花了2-3周的时间,终于MVP 版本算是出来了(今后根据需求和精力再考虑丰富更多的功能). 使用Python开发,界面部分目前还没做:架构上使用到的东西,主要使用了:Django+DjangoRestFramework+MySQL+Celery+RabbitMQ. 如下图: architectu

使用scrapy制作的小说爬虫

爬虫配套的django网站  https://www.zybuluo.com/xuemy268/note/63660 首先是安装scrapy,在Windows下的安装比较麻烦,大家好好百度下,这里就不细说了,在ubuntu下的安装 apt-get install python-dev apt-get install python-lxml apt-get install libffi-dev pip install scrapy 爬取小说的话无非就是爬取两个页面,小说介绍页和小说章节页,然后又分

centos6.5+Django+mysql+nginx+uwsgi

1.nginx的安装.这里采用nginx-1.6.0, 建立一个shell脚本然后执行. #!/bin/bash nginx_version="nginx-1.6.0" yum -y install gcc gcc-c++ pcre pcre-devel openssl openssl-devel cd soft tar zxvf $nginx_version".tar.gz" cd $nginx_version ./configure --error-log-pa

在SAE搭建Python+Django+MySQL(基于Windows)

为了与时俱进,工作闲余开始研究Python,刚一接触就被Python这"优雅"的语法吸引住!后来接触到了Django,虽然还没有太深入的研究,但对这种新概念的WEB开发很感兴趣,决定尝试用它代替Java开发小的后台程序,边用边学吧! 注:本篇只介绍基础搭建过程,不负责讲解,因为刚接触Python我也不懂! 一.SAE使用的Python环境版本 Python2.7 Django1.27 / 1.4 / 1.5 本地版本要确定好,需要用到其他的预装模块也要确定好. (我一开始使用了高版本的

《奥威Power-BI基于MySQL数据源制作报表》腾讯课程开课啦

前阵子奥威公开课讲过基于oracle数据源制作报表,有些宝宝就有小情绪了:简直就是不把我MySQL放在眼里嘛!oracle和MySQL一直以来被大家对比了很多次,同属于 Oracle 旗下产品,本是同根生,相煎何太急?这oracle和MySQL各有千秋,有着不同的侧重点和各自的小成就.为了我们的MySQL铁粉们,奥威软件决定这次就来讲一讲MySQL咯! 讲师介绍:李显斯 多年的甲方.乙方工作经验,熟悉企业的业务流程,主要从事数据库.BI开发,对ETL.数据仓库技术有着丰富的经验. 直播时间:20

Django文档制作(Windows XP)

大家好,我是成都ld,最近学习了下python和Django.我使用的是pydev+eclipse的组合进行的开发,当然,刚开始学习,由于python的方法返回值是没有标明的,所以开发变得有些蛋疼,不得不去查看方法的源码,不知道其他朋友是如何干的~~ 言归正传,今天主要介绍Django文档制作,网上说了很多方法,其实我也只是摸着石头过河,完全自己琢磨,走一步看一步,也不知道对不对,文档做出来了,暂时就这样吧~~. 第一步:首先我下载的是django的1.6.5的版本,django的目录里面有个d

在MAC下 Python+Django+mysql配置

今天在搭建Django+mysql环境的时候遇到了一点问题,记录下来. 安装环境:OS X 10.10操作系统,Python 2.7. MySQLdb其实包含在MySQL-python包中,因此无论下载还是在pip中search,都应该是搜寻MySQL-python. 以下将说明MySQLdb两种常见的安装方式: 下载安装或者pip安装MySQL-python. 源码安装 下载MySQLdb源码 下面是1.2.5的版本 https://pypi.python.org/packages/sourc

Django框架实战:搭建一个小型的服务器运维网站(一)

本文会遇到很多的代码,如果想要源代码的小伙伴,我已经分享到下方了,想要的可以自己研究一下 本人从事Python开发多年,很多小伙伴说想学一下web中的Django框架,我就用Django框架做一系列的实战项目,欢迎大家订阅.欢迎大家订阅微信公众号:Python从程序猿到程序员,或者加4913.08659,编码:柯西,编码:柯西.有不懂的可以在里面问,同时也是一个学习直播资料的平台 前言 ??不管是运维还是开发抑或是测试,工作中不免会和Linux服务器打交道,常见的操作譬如:查看CPU或内存状态.