bilibili番剧评分爬虫

python选修课学习中练手写的,主要就是查询bilibili提供得api

# -*- coding:utf-8 -*-

import requests
import json
import csv
import sys

#将windows系统默认语言从gbk-2312设置为utf-8
reload(sys)
sys.setdefaultencoding(‘utf-8‘)

def rating(bangumi_id):
    payload = {‘callback‘: ‘seasonListCallback‘}
    response = requests.get(‘https://bangumi.bilibili.com/jsonp/seasoninfo/{0}.ver‘.format(bangumi_id), params=payload)
    data = json.loads(response.text[19:-2])
    try:
        season_id = int(data[‘result‘][‘season_id‘])
        title = ‘{0}‘.format(data[‘result‘][‘media‘][‘title‘])
        score = float(data[‘result‘][‘media‘][‘rating‘][‘score‘])
        count = int(data[‘result‘][‘media‘][‘rating‘][‘count‘])
        is_finish = int(data[‘result‘][‘is_finish‘])
        try:
            writer.writerow([season_id, title, score, count, is_finish])
        except sqlite3.IntegrityError:
            pass
    except KeyError:
        try:
            season_id = int(data[‘result‘][‘season_id‘])
            title = ‘{0}‘.format(data[‘result‘][‘title‘])
            score=float(0)
            count=int(0)
            is_finish = int(data[‘result‘][‘is_finish‘])
            try:
                writer.writerow([season_id, title, score, count, is_finish])
            except sqlite3.IntegrityError:
                pass
        except KeyError:
            return None
        return None
if __name__ == ‘__main__‘:
    with open(‘bangumi.csv‘, ‘wb+‘) as csv_file:
        writer = csv.writer(csv_file, delimiter=‘,‘)
        writer.writerow([‘序号‘,‘名称‘, ‘评分(默认0分)‘, ‘评分人数(人数不足为0人)‘, ‘是否完结(1:表示已完结)‘])
        for i in range(7000):
            rating(i)

  整理结果csv https://pan.baidu.com/s/1jHX2fJ4

原文地址:https://www.cnblogs.com/kagari/p/8207233.html

时间: 2024-10-13 22:20:24

bilibili番剧评分爬虫的相关文章

Node.js 爬虫批量下载美剧 from 人人影视 HR-HDTV

这两天发现了一个叫看知乎的网站,是知乎大牛苏莉安做的,其中爬虫使用的 Node.js.这里就针对上一篇博客中的美剧小爬虫,改用 nodejs 进行实现一下,体验一下强大的 Node.js. 如果之前没有用过 JavaScript,不妨到 http://www.codecademy.com/  做一下 JavaScript 和 jQuery 的入门练习,快速熟悉一下基本语法,有其他语言基础一天时间足够.有基本的了解后,就会发现 JavaScript 的两大特点: 使用基于原型(prototype)

Python爬虫简单入门及小技巧

刚刚申请博客,内心激动万分.于是为了扩充一下分类,随便一个随笔,也为了怕忘记新学的东西由于博主十分怠惰,所以本文并不包含安装python(以及各种模块)和python语法. 目标 前几天上B站时看到一部很好玩的番剧,名字<笨女孩>,实际上是由同名的搞笑向漫画动画化的.大家都知道动画一般一周一更,很难满足我们的需求,所以我们就来编写一个爬虫,来爬取漫画咯. 那么本文的目标就是爬取<初音MIX>这部漫画(因为笨女孩我已经爬取过了>_<).这部漫画我记得是小学的时候看的,也是

IOS-高仿bilibili项目

高仿bilibili项目成长之路 (logo) 高仿bilibili项目 Github链接:(https://github.com/MichaelHuyp/Bilibili_Wuxianda) 目前完成了如下功能: 启动页的业务逻辑 带有阻力效果的轮播图 直播.推荐.番剧界面的搭建 基于ijkplayer的视频播放器(普通视频.直播视频) 七月三十号更新: 个人中心模块的搭建 集成基于来疯直播开源的LFLiveKit的手机直播功能 RTMP推流 镜像 .美颜.手电筒.摄像头方向 更新展示 关于电

【原型设计】——重构bilibili客户端

前言 哔哩哔哩动画是中国大陆的一家弹幕视频网站,在中国二次元用户中颇受欢迎. 哔哩哔哩动画之前推出过采用 Android Design 的 Android 客户端,虽然有使用了部分过时控件(例如 Scrollable Tabs)之类的问题,但整体素质依旧较高,受到 Android 用户的广泛好评.而在 6 月初的 3.9 及 4.0 更新后,哔哩哔哩抛弃了过去的 Android Design 转而使用了 iOS 风格的设计,如图所示: 左为 v3.3.0,右为v4.0.0 此次更新在用户中的争议

Python之路【第二十四篇】:Python学习路径及练手项目合集

Python学习路径及练手项目合集 Wayne Shi· 2 个月前 参照:https://zhuanlan.zhihu.com/p/23561159 更多文章欢迎关注专栏:学习编程. 本系列Python技术路径中包含入门知识.Python基础.Web框架.基础项目.网络编程.数据与计算.综合项目七个模块.路径中的教程将带你逐步深入,学会如何使用 Python 实现一个博客,桌面词典,微信机器人或网络安全软件等.完成本路径的基础及项目练习,将具备独立的Python开发能力. 完整的Python学

仿哔哩哔哩应用客户端Android版源码

这是一款高仿哔哩哔哩安卓客户端,跟官方网的差不多吧,界面也几乎是一样的,应用里面也加了一些弹出广告,大家可以参考一下吧,安装测试包在源码文件那里,大家可以多多参考一下. 哔哩哔哩弹幕网是国内知名的弹幕视频分享站,常被动漫迷们昵称为bilibili,B站,最大同...(划掉.哔哩哔哩动画是哔哩哔哩弹幕网的官方客户端.哔哩哔哩移动客户端专注于ACG相关内容的在线视频分享,目前有十个分区:番剧.动画.游戏.娱乐.电影.电视剧.音乐.科技.鬼畜.舞蹈. 详细说明:http://android.662p.

脚本进击之汉诺塔tatatata……

操作环境依旧是centos7与centos6.阿拉的脚本都是放在7上了,6里的通用性大概有0.5%左右的误差,错误和可完善之处尽请指正. 请忽略中二的标题>_<. 嘛,某种意义上,这个标题还算贴切.因为这个问题咋一看到就是会给人一种头大的感觉,踏踏踏踏踏,塔塔塔塔塔塔-- 哦急死尅.先看过题目再来说头大的问题吧. 原题如下: 汉诺塔(又称河内塔)问题是源于印度一个古老传说.大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着 64片黄金圆盘.大梵天命令婆罗门把圆盘从下面

BliBli抢楼全攻略

B站抢楼是一个很好玩的事情,每当新番出新集时.总有很多人想能够在前排发表评论,但是因为人数众多,往往不能如愿,今天就教大家一个抢楼的好办法. 我们平时抢楼的整个流程是这样的: 1.在官方放出的新番更新时间时等待 2.到时间后一直不停的刷新网页,等待新集数网页链接出现,出现后点击进入 3.等待网页载入完成,然后写入并发表评论. 但是这么做,基本是不可能抢到一楼的. 在看之前最好先了解下http协议基础内容,知道post和get就行了:这里有一篇文章很不错:HTTP 协议详解 了解之后,测试就可以得

仿哔哩哔哩应用客户端Android版源码项目

这是一款高仿哔哩哔哩安卓客户端,跟官方网的差不多吧,界面也几乎是一样的,应用里面也加了一些弹出广告,大家可以参考一下吧,安装测试包在源码文件那里,大家可以多多参考一下. 哔哩哔哩弹幕网是国内知名的弹幕视频分享站,常被动漫迷们昵称为bilibili,B站,最大同...(划掉.哔哩哔哩动画是哔哩哔哩弹幕网的官方客户端.哔哩哔哩移动客户端专注于ACG相关内容的在线视频分享,目前有十个分区:番剧.动画.游戏.娱乐.电影.电视剧.音乐.科技.鬼畜.舞蹈. 源码下载: http://code.662p.co