动漫《那年那兔那些事儿》弹幕爬虫采集数据分析

开启弹幕已经成为很多年轻人看剧时的一种习惯。最近大热的几部电视剧,弹幕也十分精彩有趣,甚至出现“弹幕比剧好看”的现象。

弹幕的出现消解了观影的孤独感,增加了互动性。可以说,弹幕是对视频作品的二次创作,有趣的弹幕甚至能让一部无聊的视频重焕生机。另一方面,视频创作者也能够从弹幕上看到观众对自己所创作视频的评价,并能够从中汲取有用的信息以便完善自己日后的视频制作。

“那年那兔那些事”是以爱国为主旋律的一部国漫,在“抗日神剧”等粗制滥造的国产抗日剧的现状下,因其精良的制作素质和深厚的爱国主义内涵深受观众尤其是年轻观众的喜爱。

拓端数据研究人员根据后台收录的弹幕数据,对本番进行分析。

1

军事、外交和故乡为热门话题

可以看出“那年那兔那些事”的弹幕关键词中:中国,兔子,祖国,泪目等弹幕占比为大多数,所以可以看出B站观众还是很有爱国心的,B站可以考虑多上架此类爱国番。

图表1

?

?

军事、外交和故乡成为弹幕谈论最多的话题,这也对应了这一部国漫的爱国主旋律。从情绪评分来看,网友们对军事、外交、国家英雄和台湾话题的弹幕表现出积极正面情绪,对台湾的积极评论如“成立中华联邦促进台湾回归”、“统一台湾势在必行”等,以及对先烈们的致敬“谢谢你们,先烈们,谢谢你们,英雄们。”、“英雄们,欢迎回家!”等。

2

每一季弹幕主题和情感表现

从每一季的弹幕数量来看,第一季最为火爆,第四季最少,说明这部动漫刚上线的时候关注度很高,之后的弹幕数量不高可能是因为剧情发展比较平稳。

图表2

?

从第一季的剧情来看,讲述了种花家的兴衰讲起,创立自己的祖国,再到后来历经磨难崛起等一系列事件,对应了国共内战、抗日战争、抗美援朝等历史事件,情绪倾向结果中第一季网友在先辈、种花家和抗日的话题下也表现出积极情绪。第二季讲述了建国前后,兔子们由于被封锁而与很多第三世界的河马作伴,在冷战中,夹缝中求生存,与鹰酱、毛熊重修旧好并重新回到世界舞台,第二季网友在外交主题下表现出积极情绪。

3

中午晚上弹幕最多,凌晨最强

从24小时的分布来看,弹幕发布主要集中在中午12点和晚上8-9点的休息时间。

图表3

?

从弹幕分布的高峰时间,可以看到每小时最高有多达800条弹幕的输出,而且从上面的每集中弹幕的信息来看,可见观众对于这部番的认可。从弹幕的情绪评分来看,有较强情绪的弹幕大多发布在晚上和凌晨深夜打卡的铁杆粉。

非常感谢您阅读本文,有任何问题请联系我们!

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

?QQ:3025393450

?

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务

?

原文地址:https://www.cnblogs.com/tecdat/p/11003509.html

时间: 2024-11-07 17:14:20

动漫《那年那兔那些事儿》弹幕爬虫采集数据分析的相关文章

《那年那兔那些事》观后感

我们生活在现在,吃得饱穿的暖.但是总觉得自己很不幸福.需要那么努力的去奋斗.抱怨社会的不公平.然而世界上什么时候公平过. 我们都快忘了从八国联军侵华的时候开始什么时候公平过.从有了人便有了三六九等谈什么公平. 那年那兔那些事描述的非常简单,每集几分钟的动画.把世界各国比喻成了各种动物.把历史上重要的事件比喻成了我们生活中经常遇到的一些事情.幽默风趣,更容易让人理解事件,以及事件背后的含义.但是该表现的感觉都表现了. 尤其是建国初期那段艰苦奋斗的日子,让人很是感动.这几集又让我想起了那时候经常提到

网络爬虫采集数据几个问题

最近在做网络爬虫抓取数据,遇到几个重要问题,记录下来,以免忘记. 目前用的是第三方开源爬虫框架webmagic,所以暂时记录下来的不是爬虫实现和结构上的问题,而主要是在此框架上的逻辑开发问题. 1.要采集的数据在不同的页面上         比如,采集网站http://down.7po.com/上的应用,在应用列表页面有应用的id等信息,而此应用的详细页面没有列表页面的这些字段信息,那么就要从列表页面和详细页面中取出字段然后再合成一个应用的整体数据.对这个问题,比较直接的思路是,可以将先取出的一

新浪微博热门评论爬虫采集

本科毕业设计的时候做实验数据集的需要,自己写了一个微博转发的采集器,今晚心血来潮,整理了一下原来的代码,重新写了一个热门微博评论的的采集爬虫.效果不错. ps:有一个想法就是采集热门微博的评论,然后在自己的账号上自动用脚本发布采集下来的热门评论.这是很有趣的一件事.

详解如何用爬虫采集瓜子二手车车辆数据及联系方式

说起大数据,估计大家都觉得只听过概念,但是具体是什么东西,怎么定义,估计很多人都没有一个明确的概念,在<大数据时代>提到了大数据的4个特征,一个是数量大,一个是价值大,一个是速度快,一个是多样性.? 一个是数量比较大,大致有多大,就是大到PB级别,甚至ZB级别,1PB等于1024TB,1TB等于1024G,那么1PB等于100多G,当然了具体的计算方法可以相关资料数据进行查询,总之,和传统的单个网站数据库存储的数据相比,已经是它的上百倍还多,而只有数据体量达到了PB级别以上,才能被称为大数据.

go语言实现爬虫采集联想词

/**************************************************** go语言实现爬虫_联想词 咨询:qq:1465376564 黄哥python培训班所写 python北京周末培训班 https://github.com/pythonpeixun/article/blob/master/beijing_weekend.md python 上海周末培训班 https://github.com/pythonpeixun/article/blob/master/

Intent的那些些事儿

请原谅我用这么文艺的标题来阐释一颗无时无刻奔腾着的2B青年的心.可是今天要介绍的Intent绝不2B,甚至在我看来,或许还有些许飘逸的味道,至于飘逸在哪里呢?那我们就好好来剖析剖析Intent和它的好搭档IntentFilter的基友情. 开场告白 Intent在Android大家庭中是一个活泼的小男孩,从小就是交际草.在代码中,Activity.Service.BroadcastReceiver这三个重要的大妈级重量组件,之间的调用关联都是依靠Intent去交流的,例如Activity的sta

[学些东西]用爬虫练习网站来练习burp suite

黑板客爬虫第二关 http://www.heibanke.com/lesson/crawler_ex01 打开burp suite,设置好firefox的代理为127.0.0.1:8080 在burp suite的proxy的intercept选卡,打开intercept is on,抓包. 然后将抓到的包发送到intruder, POST /lesson/crawler_ex01/ HTTP/1.1 Host: www.heibanke.com User-Agent: Mozilla/5.0

【Python3爬虫】斗鱼弹幕爬虫

在网上找到了一份斗鱼弹幕服务器第三方接入协议v1.6.2,有了第三方接口,做起来就容易多了. 一.协议分析 斗鱼后台协议头设计如下: 这里的消息长度是我们发送的数据部分的长度和头部的长度之和,两个消息长度是一样.然后要注意的是该协议使用的是小端整数,所以我们要对数据进行处理后再发送,这里可以使用int.to_bytes()将整数转变成小端整数的形式.示例如下: int.to_bytes(12,4,'little')   # b'\x0c\x00\x00\x00' int.to_bytes(12,

DNS-那些事儿

一.DNS为何物 DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串.通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析).DNS协议运行在UDP协议之上,使用端口号53. 二.递归查询和迭代查询的区别 (1)递归查询递归查询是一种DNS 服务器的查询模式,在该模式下DNS 服务器接收到客户机请求,必须使用一个准确的查询结果回复客户机.如果D