利用Python分析“女神大会”,分析码农最喜欢的top10女星!

前言

懂球帝上的“女神大会”专栏,作为一个大型“钢铁直男”聚集地,“懂球帝”上对各位女神的评分,对广大“钢铁直男”群体也具有一定代表性。这么好的地方,咱们必须得用Python分析一波了呀。

基本环境配置

版本:Python3

系统:Windows

相关模块:requests、bs4、pandas

用pip安装即可。

数据来源

目前女神大会更新至了第 90 期,总共出场了 90 位女神,界面如下:

我们通过 fiddler 获取该界面中女神的照片地址以及每一篇文章的 id 编号,用于之后的爬取和可视化,代码如下:

另一方面,每位女神的评分都在下一期当中,我们需要爬取文章内容进行获取:

爬取代码如下:

数据分析结果

排名相对靠后的几位:

区域对比

分区域看一下目前各个区域排名前十的名单:




我们进行一下区域的对比:

年份对比

你最喜欢的女星是哪个呢?欢迎留言评论,同时如果你跟我一样都喜欢python,想成为一名优秀的程序员,也在学习python的道路上奔跑,欢迎你加入python学习群:839383765 群内每天都会分享最新业内资料,分享python免费课程,共同交流学习,让学习变(编)成(程)一种习惯!

原文地址:http://blog.51cto.com/14186420/2348285

时间: 2024-08-26 13:18:21

利用Python分析“女神大会”,分析码农最喜欢的top10女星!的相关文章

#IT明星不是梦#利用Python进行网站日志分析

网站的访问日志是一个非常重要的文件,通过分析访问日志,能够挖掘出很多有价值的信息.本文介绍如何利用Python对一个真实网站的访问日志进行分析,文中将综合运用Python文件操作.字符串处理.列表.集合.字典等相关知识点.本文所用的访问日志access_log来自我个人的云服务器,大家可以从文末的附件中下载. 1.提取指定日期的日志 下面是一条典型的网站访问日志,客户端访问网站中的每个资源都会产生一条日志. 193.112.9.107 - - [25/Jan/2020:06:32:58 +080

利用python广西快乐十分源码出租爬取网易云歌手top50歌曲歌词

python广西快乐十分源码出租 dsluntan.com Q:3393756370 VX:17061863513近年来,发展迅速,成为了最炙手可热的语言. 那么如何来进行网易云歌手top50的歌曲歌词爬取呢 首先进行网易云并进行喜欢的歌手搜索如下: 在这里需要注意的是http://music.163.com/#/artist?id=1007170并不是真的我们需要的连接,真实的链接应该是http://music.163.com/artist?id=1007170 搞清楚了连接的问题之后,就要进

一个码农在魔都如何生活?我用Python分析得到以下结果

程序员小马刚毕业来到上海闯荡,开始了魔都的生活,每个月只有可怜的一点工资,因为刚毕业,好不容易找到一份工作,月薪4500块.为省房租,所以住的比较远,每天要坐两个小时的地铁上下班! 小马是一个吃货,喜欢吃喜欢旅游的,下班后躺在床上,想着如果这次项目完成了: 如果能发5000块工资就可以约隔壁部门的大美女吃一顿大餐, 如果发了6000块就可以去买双球鞋,原来那双都破个洞了 如果发了7000块就可以去趟杭州玩几天,西湖美景美如画 想着想着,心里美滋滋的,干脆自己写一个程序提醒我多好啊!光说不练假把式

Python为什么这么厉害? 不想成为专业码农? 来学习Python吧!

什么是码农? 什么是码农,一张图解释码农大家用它来自娱自乐,然而,其中的辛酸只有程序员自己知道.程序员冲锋在第一线,各个人都在盯着你的结果,不断给你施加压力.你就是一个机器一样的干活,除了干活还是干活.程序员的压力是很大的,在繁忙的工作中,累的喘不过气,更没有精力时间发展人脉,没有时间谈朋友.很多时候,并不是程序员情商低找不到女朋友,而是他的工作环境没有目标对象,同时也没有很多的业余时间.工作的时候,只固定在一个小小的办工作上.可想而知,发展空间是什么. . 在文章末有0基础小白学习资料(欢迎关

利用Python+163邮箱授权码发送邮件

背景 前段时间写了个自动打卡的脚本,但是脚本不够完善,我需要知道,打卡到底成没成功,因此,我想到了用Python执行完代码之后,再执行一段发送邮件的代码.需求开始明确了,就开始分析和写代码实现吧. 分析 SMTP(Simple Mail Transfer Protocol),即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式. python的smtplib提供了一种很方便的途径发送电子邮件.它对smtp协议进行了简单的封装. 代码实现 import smt

Tomcat7.0源码分析——请求原理分析(上)

前言 谈起Tomcat的诞生,最早可以追溯到1995年.近20年来,Tomcat始终是使用最广泛的Web服务器,由于其使用Java语言开发,所以广为Java程序员所熟悉.很多人早期的J2EE项目,由程序员自己实现Jsp页面或者Servlet接受请求,后来借助Struts1.Struts2.Spring等中间件后,实际也是利用Filter或者Servlet处理请求,大家肯定要问了,这些Servlet处理的请求来自哪里?Tomcat作为Web服务器是怎样将HTTP请求交给Servlet的呢? 本文就

Android源码分析--system_server进程分析

在上一篇博文中我们进行了有关Zygote进程的分析,我们知道Zygote进程创建了一个重要的进程–system_server进程后就进入了无限循环中,之后Android系统中的重要任务就交给了system_server进程,作为zygote的嫡长子进程,system_server进程的意义非凡,今天我们来分析一下system_server进程. 创建system_server进程 在ZygoteInit中main方法中,通过调用startSystemServer方法开启了system_serve

Python【8】-分析json文件

一.本节用到的基础知识 1.逐行读取文件 for line in open('E:\Demo\python\json.txt'): print line 2.解析json字符串 Python中有一些内置模块可以非常便捷地将json字符串转换为Python对象.比如json模块中的json.relaods()方法可以将json字符串解析为相应的字典. import json s='{ "a": "GoogleMaps\/RochesterNY", "c&qu

Tomcat7.0源码分析——请求原理分析

Tomcat7.0源码分析--请求原理分析 谈起Tomcat的诞生,最早可以追溯到1995年.近20年来,Tomcat始终是使用最广泛的Web服务器,由于其使用Java语言开发,所以广为Java程序员所熟悉.很多人早期的J2EE项目,由程序员自己实现Jsp页面或者Servlet接受请求,后来借助Struts1.Struts2.spring等中间件后,实际也是利用Filter或者Servlet处理请求,大家肯定要问了,这些Servlet处理的请求来自哪里?Tomcat作为Web服务器是怎样将HTT