用Python爬取"王者农药"英雄皮肤

0.引言

作为一款现象级游戏,王者荣耀,想必大家都玩过或听过,游戏里中各式各样的英雄,每款皮肤都非常精美,用做电脑壁纸再合适不过了。本篇就来教大家如何使用Python来爬取这些精美的英雄皮肤。

1.环境

操作系统:Windows / Linux

Python版本:3.7.2

2.需求分析

我们打开《王者荣耀》官网,找定位到英雄列表的页面

可直接点此链接:

https://pvp.qq.com/web201605/herolist.shtml

在这个网页中包含了所有的英雄,头像及英雄名称。点击其中一个英雄的头像,如“嫦娥”,进去后如下图:

我们记下此时的网址

https://pvp.qq.com/web201605/herodetail/515.shtml

再后退到英雄列表页面,点“甄姬”进去查看:

https://pvp.qq.com/web201605/herodetail/127.shtml

可以看到这些网址几乎是固定不变的,变化的只是515、127这些数字,这些其实就是代表的英雄数字编号。

那么第一个关键点就来了,怎么找出各个英雄所对应的数字编号呢?

我们回到最初的英雄列表页面,打开浏览器的开发者工具<F12>,刷新页面、仔细观察,你会找到一个herolist.json的文件,如图所示:

这里记录了各个英雄的信息,其中就包含了每个英雄对应的数字编号了,请忽略这里截图中的乱码显示。我们切到herolist.json中的Headers,就可以拿到该请求的URL地址,进而就可以把英雄及其对应的数字,编号都提取出来了。

有了英雄编号的对应关系,再找寻下英雄皮肤的链接规律。

现在重新进入一个英雄的网址,打开浏览器的开发者工具,刷新页面,在Network下刷新并找到英雄的皮肤图片,如图所示:

在Headers中查看该图片的网址,查看即Request URL处的链接:

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/515/515-bigskin-1.jpg

找寻一个看看

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/529/529-bigskin-1.jpg

继续寻一个看看

https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/127/127-bigskin-4.jpg

仔细分析如上三个链接,我们可以把英雄皮肤的URL拆分开来看。它是由一个固定前缀(我们可以记为base_url),再加上英雄数字编号、"bigskin"、皮肤编号、".jpg"组合而成,如下:

base_url / hero_num / hero_num - bigskin - heroskin_num .jpg

拿到了各个英雄皮肤的URL地址后,我们就可以进行图片的下载并保存在本地了。

3.代码演示

首先导入我们所用到的模块

import requests

import os

注:requests是非内置模块,若环境中没有,需自行安装:

pip install requests

3.1 提取英雄名字及数字

使用herolist.json拿到herolist,并提取出我们关心的内容

# 英雄的名字json

url = ‘http://pvp.qq.com/web201605/js/herolist.json‘

head = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36‘}
response = requests.get(url, headers=head)
hero_list = response.json()

# 提取英雄名字和数字
hero_name=list(map(lambda x:x[‘cname‘], hero_list)) 

hero_number=list(map(lambda x:x[‘ename‘], hero_list))

3.2 构造英雄皮肤的URL

首先准备好我们的BASE_URL,即英雄皮肤的固定前缀。

h_l=‘http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/‘

接下来构造好英雄皮肤的URL,同时我们需要对每一个英雄的所有皮肤进行遍历,如下:

# 逐一遍历英雄
for i in hero_number:
# 逐一遍历皮肤,此处假定一个英雄最多有15个皮肤
for sk_num in range(15):
hsl = h_l + str(i)+‘/‘+str(i)+‘-bigskin-‘+str(sk_num)+‘.jpg‘

hl = requests.get(hsl)

3.3 存储图片

最后我们就只需将获取到的图片保存在本地即可。

# 将图片保存下来,并以"英雄名称_皮肤序号"方式命名
with open(hero_name[num] + str(sk_num) + ‘.jpg‘, ‘wb‘) as f:
f.write(hl.content)

4.效果展示

最终的爬取效果如下图所示。

5.总结

短短几十行代码就可以把心爱英雄的精美皮肤保存下来,赶快实操起来吧!

关注公众号「Python专栏」,后台回复「zsxq04」,获取本文全套源码!

![Python专栏二维码](https://img-blog.csdnimg.cn/20190228220401806.jpeg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTIzNjU4Mjg=,size_4,color_FFFFFF,t_70#pic_center =200x200)

原文地址:https://blog.51cto.com/miracleyoung/2367918

时间: 2024-09-30 04:48:42

用Python爬取"王者农药"英雄皮肤的相关文章

20行Python代码爬取王者荣耀全英雄皮肤

引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 爬取皮肤本身并不难,难点在于分析,我们首先得得到皮肤图片的url地址,话不多说,我们马上来到王者荣耀的官网: 我们点击英雄资料,然后随意地选择一位英雄,接着F12打开调试台,找到英雄原皮肤的图片地址: 接着,我们切换一下英雄的皮肤,会发现图片地址没有明显的变化,只是最后的数字序号改变了,我们将两

16行python代码 爬取王者荣耀全皮肤

此处感谢CSDN博主yaoyefengchen 小白练手 相信现在很多人都喜欢玩王者荣耀这款手游,里面好看的皮肤令人爱不释手.那么你有没有想过把王者荣耀高清皮肤设置为壁纸,像下面这样 今天就来教大家如何利用python16行代码,实现王者荣耀全部高清皮肤的下载. 具体的操作分为两步: 1. 找到皮肤图片的地址 2. 下载图片 1. 寻找皮肤图片的地址 1. 找到英雄列表 百度"王者荣耀"进入官网 https://pvp.qq.com/.这里以Goole Chrome浏览器为例,在更多工

利用Python爬取OPGG上英雄联盟英雄胜率及选取率信息

一.分析网站内容 本次爬取网站为opgg,网址为:” http://www.op.gg/champion/statistics” ? 由网站界面可以看出,右侧有英雄的详细信息,以Garen为例,胜率为53.84%,选取率为16.99%,常用位置为上单 现对网页源代码进行分析(右键鼠标在菜单中即可找到查看网页源代码).通过查找“53.84%”快速定位Garen所在位置 由代码可看出,英雄名.胜率及选取率都在td标签中,而每一个英雄信息在一个tr标签中,td父标签为tr标签,tr父标签为tbody标

Python爬取王者荣耀官网,实现一对一下载软件!

效果: 我没有弄文件夹保存,因为皮肤与英雄都是一一对应,这样子更加方便操作. 点击下载皮肤后,会自动从官网下载一个json文件,所以出了新英雄.新皮肤软件会自动更新.高清图: 但是有个别新皮肤官网也没有提供数据,找不到新皮肤下载的选择项时,点击影藏皮肤获取按钮输入英雄名字,再点击隐藏皮肤下载即可. 环境: 系统:Windows 模块:requests. json.os.time.tkinter 编辑器:sublime(获取视频教程) tkinter部分代码 界面还算比较简单的,就那么几个组件.

python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松

1.环境 python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄壁纸,包括这些英雄的皮肤,不废话了,go! 3.分析 首先,我们打开王者荣耀的英雄资料 然后,日常F12打开浏览器的开发者工具 可以看到这里返回了一个json数据,里面包含了英雄的名字(cname),皮肤名字(skin_name),英雄id(ename)这个id后面的皮肤有用 具体某一个英雄的网址,

python爬虫入门练习,使用正则表达式和requests爬取LOL官网皮肤

刚刚python入门,学会了requests模块爬取简单网页,然后写了个爬取LOL官网皮肤的爬虫,代码奉上 #获取json文件#获取英雄ID列表#拼接URL#下载皮肤 #导入re requests模块 import requestsimport reimport time def Download_LOL_Skin(): #英雄信息Json文件地址:https://lol.qq.com/biz/hero/champion.js #获取英雄信息列表 json_url = "https://lol.

使用python爬取csdn博客访问量

最近学习了python和爬虫,想写一个程序练练手,所以我就想到了大家都比较关心的自己的博客访问量,使用python来获取自己博客的访问量,这也是后边我将要进行的项目的一部分,后边我会对博客的访问量进行分析,以折线图和饼图等可视化的方式展示自己博客被访问的情况,使自己能更加清楚自己的哪些博客更受关注,博客专家请勿喷,因为我不是专家,我听他们说专家本身就有这个功能. 一.网址分析 进入自己的博客页面,网址为:http://blog.csdn.net/xingjiarong 网址还是非常清晰的就是cs

python爬取某个网站的图片并保存到本地

python爬取某个网站的图片并保存到本地 #coding:utf-8 import urllib import re import sys reload(sys) sys.setdefaultencoding('gb2312') #获取整个页面的数据 def getHtml (url): page = urllib.urlopen(url) html = page.read() return html #保存图片到本地 def getImg(html): reg = r'src="(.+?\.

python爬取某个网页的图片-如百度贴吧

python爬取某个网页的图片-如百度贴吧 作者:vpoet 日期:大约在冬季 注:随意copy,不用告诉我 #coding:utf-8 import urllib import urllib2 import re if __name__ =="__main__": rex=r'src="(http://imgsrc.baidu.com/forum/w%3D580.*?\.jpg)"'; Response=urllib2.urlopen("http://t