Python大佬分析了15万歌词,告诉你民谣歌手们到底在唱什么

前几天小编写了两篇利用Python采集网易云歌词采集网易云音乐歌曲文章,相信小伙伴们经过实践之后都能够顺利的采集到自己想要听的歌曲。下面的歌词是小编去年11月份采集的民谣歌词,经过统计,歌词量达到将近15万。

用Python采集的民谣歌词

心血来潮,想利用Python来分析一下民谣歌手们到底在唱些什么鬼~~

首先运用jieba库进行分词和词频统计分析,得到歌词中的词频统计,部分主要代码如下图所示:

运用jieba库进行分词和词频统计分析

得到的词频后将其导入到Excel表格中,详情如下图:

民谣歌手词频统计表

利用词云将其进行可视化,得到效果图如下:

歌词词云可视化

歌词词云可视化

从词频中,我们可以感受到民谣歌手们时常提及青春,感叹韶华易逝,青春小鸟一去不回来。他们会觉得很孤单,但是并不沉浸在忧伤之中,而是心中向往着远方,对整个世界充满希望、对未来充满阳光。嘿嘿,民谣歌手们在传递正能量咧~~

之后通过词频统计分析歌手们喜欢的季节,得到的数据统计如下图所示:

民谣歌手们喜欢的季节

由饼图可以看出,民谣歌手们比较喜欢春天~~等待下一个春天回来;飘在异乡的雪 覆盖了春天~~

继续分析民谣歌手的歌词,探索民谣歌手们到底喜欢活在哪一天,详情如下图所示:

民谣歌手们到底喜欢活在哪一天

由柱状图可以看出,民谣歌手们更加喜欢明天,对于明天充满希望。大家都说我拿青春赌明天,看来是有道理滴。爱人你可感到明天已经来临;却不知明天的船舶停靠在何方~~

通过城市地点词频统计,探索民谣歌手们最喜欢哪个城市,得到的统计图如下所示:

民谣歌手们最喜欢哪个城市

可以很明显的看出,北京直接开挂,完胜其他城市。在南方城市中,民谣歌手念叨最多的还是成都,和我在成都的街头走一走,喔喔喔~~~当然,南京、上海、昆明也有提及,但是分量不大。

那么民谣歌手们到底喜欢南方还是北方呢?看看下图你就知道了。

可以看出来,民谣歌手们还是蛮喜欢南方菇凉的。北方的村庄住着一个南方的姑娘;南方姑娘 你是否习惯北方的秋凉;南方姑娘 你是否喜欢北方人的直爽~~~赵雷歌曲《南方姑娘》送给你^_^

最后利用SnowNLP对每一位民谣歌手的歌词进行情感分析,得到的统计图如下所示:

民谣歌手的情感分析

可以看的出来,许巍的歌曲中表达的情绪是比较嗨的,充满正能量;而赵雷、逃跑计划等人唱的歌曲所表达的情绪比较平缓,像是在不慌不忙的给你讲故事;尧十三等人的歌曲相对忧伤一些。不过话说回来,民谣歌手们的情绪总的来说还是比较开心的。

最后小编总结一下民谣歌手到底在唱什么,唱的是寂寞么?当然不是~~~

通过15万民谣歌词的分析,我们可以得出民谣歌手们时常感叹青春,觉得韶华易逝。通常呢,他们会觉得很孤单,但是并不沉浸在忧伤之中,而是心中向往着远方,对整个世界充满希望、对未来充满阳光。他们喜欢春天和冬天,喜欢生活在明天,对未来充满着信心和希望。他们喜欢北方的城市,尤其是首都北京,但同时呢,他们又惦记着南方姑娘,最希望和女票去的南方城市是成都、南京、香港和昆明~~

以上观点仅供大家参考,欢迎大家拍砖~~

^_^最后小编祝大家周末愉快^_^

原文地址:http://blog.51cto.com/13389043/2113201

时间: 2024-10-06 09:23:00

Python大佬分析了15万歌词,告诉你民谣歌手们到底在唱什么的相关文章

田涛:华为如何把15万秀才变成兵

一.组织黑洞:山头,腐败,惰怠 生理学家认为,每个人与生俱来都是带着病毒来到这个世界.马克思说,"人从出生之日起,就大踏步地向坟墓迈进".一个组织又何尝不是如此?政治组织.社会组织.企业概莫如此.当它生机勃勃的诞生之时,腐蚀.侵蚀这个组织的各种病症也都相伴而发生了. 组织的病症源于人,源于人性.西方组织管理学认为,人天生是自私的,懒惰的,贪婪的,正因为单个的个人与生俱来的自私.贪婪.惰怠,所以,当这些携带着同样病毒的一群人,构成一个组织的时候,也同样就构成了对组织从发生.发展到终结的全

Python代码分析工具:PyChecker、Pylint

1 概述 PyChecker是Python代码的静态分析工具,它能够帮助查找Python代码的bug,而且能够对代码的复杂度和格式等提出警告. PyChecker可以工作在多种方式之下.首先,PyChecker会导入所检查文件中包含的模块,检查导入是否正确,同时检查文件中的函数.类和方法等. PyChecker可以检查出来的问题有如下几种: 全局量没有找到,比如没有导入模块 传递给函数.方法.构造器的参数数目错误 传递给内建函数和方法的参数数目错误 字符串格式化信息不匹配 使用不存在的类方法和属

Python性能分析工具Profile

Python性能分析工具Profile 代码优化的前提是需要了解性能瓶颈在什么地方,程序运行的主要时间是消耗在哪里,对于比较复杂的代码可以借助一些工具来定位,python 内置了丰富的性能分析工具,如 profile,cProfile 与 hotshot 等.其中 Profiler 是 python 自带的一组程序,能够描述程序运行时候的性能,并提供各种统计帮助用户定位程序的性能瓶颈.Python 标准模块提供三种 profilers:cProfile,profile 以及 hotshot. p

python日志分析

微秒   毫秒 datetime seek定位指针 从行尾到行首 fd.seek(-2,1)  1  当前位置 fd.tell() fd.seek(-2,2)  2   最后位置 fd.tell() fd.seek(0,0)   0  最前位置 read(1)读一位    read() 全部都读 tac与cat    行首到行尾 reversed   翻转字符串 只读一部分    通过时间判断 200 404  503  十分钟之内   第八列  apache.log 1.首先匹配时间格式, D

转载》【3个免费名额】爱加密TFC大会15万手游保护服务免费送!速来报名!

[3个免费名额]爱加密TFC大会15万手游保护服务免费送!速来报名! Ps:应用有需要做加密定制的小伙伴,可以报名参加哦~~ 2015年3月17日至3月18日,由上方汇举办的国内知名游戏盛典2015第10届TFC全球移动游戏大会在北京国际会议中心开展.作为移动应用安全保护领域的领军企业,爱加密作为高端赞助商出席此次大会并将送出价值15万(3个名额,每个5万元)的高端手游安全保护服务. 这些保护项目统统免费送 防止手游内购破解 资源文件指纹签名保护 防二次打包 代码混淆 源码加壳 防止外挂调试器

Python性能分析指南(未完成)

英文原文:http://www.huyng.com/posts/python-performance-analysis/ 译文:http://www.oschina.net/translate/python-performance-analysis 虽然你所写的每个Python程序并不总是需要严密的性能分析,但是当这样的问题出现时,如果能知道Python生态系统中的许多种工具,这样总是可以让人安心的. 分析一个程序的性能可以归结为回答4个基本的问题: 1.它运行的有多块? 2.那里是速度的瓶颈?

第五次作业——python效能分析与几个问题(个人作业)

第五次作业--效能分析与几个问题(个人作业) 前言 阅读了大家对于本课程的目标和规划之后,想必很多同学都跃跃欲试,迫不及待想要提高自身实践能力,那么就从第一个个人项目开始吧,题目要求见下. 阅读 阅读<构建之法>第一章至第三章的内容,并在下方作业里体现出阅读后的成果.特别是第2章中的效能分析及个人软件开发流程(PSP). 参考文章: <构建之法>教学笔记--Python中的效能分析与几个问题 四则运算器效能分析 软工第2次作业-四则运算器 题目描述 可以选择以下题目(或者自主选择题

Python性能分析

Python性能分析 https://www.cnblogs.com/lrysjtu/p/5651816.html https://www.cnblogs.com/cbscan/articles/3341231.html 使用ipdb 使用profile import profile def profileTest(): Total =1; for i in range(10): Total=Total*(i+1) print Total return Total if __name__ ==

Python分析了 7 万款 App,万万没想到

摘要:使用 Scrapy 爬取豌豆荚全网 70,000+ App,并进行探索性分析. 写在前面:若对数据抓取部分不感兴趣,可以直接下拉到数据分析部分. 1 分析背景 之前我们使用了 Scrapy 爬取并分析了酷安网 6000+ App,为什么这篇文章又在讲抓 App 呢? 因为我喜欢折腾 App,哈哈.当然,主要是因为下面这几点: 第一.之前抓取的网页很简单 在抓取酷安网时,我们使用 for 循环,遍历了几百页就完成了所有内容的抓取,非常简单,但现实往往不会这么 easy,有时我们要抓的内容会比