爬虫在游戏数据分析的一个实践

在实际工作中,数据的来源不能局限于自家的数据库或者成型的后台,在做某些市场分析或是竞争对手开服节奏分析的情况下,对竞争对手数据的获得显得更为至关重要,本文就以获取某大平台开服数据作为一个案例,简要的介绍另一种获取数据的方法,网络爬虫技术。

何为网络爬虫,爬虫是一个自动提取网页的程序,为搜索引擎在万维网上下载网页,是搜索引擎的重要组成部分。简单的讲就是从一个或若干个初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的某些停止条件。

本文利用爬虫收集各大平台开服数据列表上的相关数据,减去了在收集开服数据的繁琐,以下就是一个简单爬虫及正则的例子,从某知名页游平台上抓取开服数据。爬起中文数据常有的问题就是不规格的编码模式,这需要在程序的编写过程中注意编码转换。

在此之前简要的讲一下获取数据的另一个重要内容,正则表达式。正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。正则表达式元字符及语法可以在http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx详细查阅。

使用python编写爬虫程序,导入相应的模块urllib2,使用urlopen下载网页,在网页中使用正则获得想要获得相应的数据。

简要的介绍urllib2模块中用到的方法,

urllib.urlopen(url[, data[, proxies]]) :

url: 表示远程数据的路径

data: 以post方式提交到url的数据

proxies:用于设置代理

urlopen返回对象提供方法:

read() , readline() ,readlines() , fileno() , close() :这些方法的使用方式与文件对象完全一样

info():返回一个httplib.HTTPMessage对象,表示远程服务器返回的头信息

getcode():返回Http状态码。如果是http请求,200请求成功完成;404网址未找到

geturl():返回请求的url

import urllib2

import re

msg=urllib2.urlopen(‘http://www.****.com/‘).read()

res=re.findall(‘tr>[\s\S]*?target=\"_blank\" class=\"cred\">(.*?)(.*?)[\s\S]*?

‘,msg)

for res1 in res:

for res2 in res1

print res2.decode(‘utf-8‘)

用MySQL储存数据,先要在自己的数据库里建立一个空表,这里我建立了一个名为KFdata的数据库,表名为data_one,相应的在python中导入相应的MySQL模块,并与相应数据库连接,将数据写入数据库。

import MySQLdb

db=MySQLdb.connect(host="localhost",user="root",password="123456",db="KFdata",use_unicode=1,charset=‘utf-8‘)

cursor=db.cursor()

for i in range(20):

cursor.execute("insert into data_one values(%s,%s,%s,%s,%s,%s,%s,%s)",(id[i],‘h‘,index[i],time1[i],size[i],hit[i],lz[i],title1[i]))

转载请注明来源:http://www.gamedatas.com

原文地址:http://www.gamedatas.com/archives/73

爬虫在游戏数据分析的一个实践

时间: 2024-07-29 11:48:15

爬虫在游戏数据分析的一个实践的相关文章

游戏数据分析的艺术——互动出版网

这篇是计算机类的优质预售推荐>>>><游戏数据分析的艺术> 前言 为什么要写这本书 无法衡量,就无法改进. 每一个产品都是艺术品,游戏是产品,故游戏也是艺术品.然而产品需要用户,用户与产品都需要衡量,深入地分析并解决问题,提升产品,经营用户. 游戏伴随互联网的发展逐步成为重要的产业,这其中诞生了像暴雪这样的公司,同时也诞生了像西山居这样的民族品牌.我们的技术越来越好,我们的界面越来越炫,我们的设计策划力量也在不断成长.各种针对这个行业的书籍层出不穷,然而我们却发现,在越

[游戏数据分析]WAU模型

声明:本博客中所采用的数据并非真实数据,会对真实数据加以变换,重在讨论游戏数据分析的思路. 这里是参考友盟的WAU模型[文章网址,  演示网址],利用某款游戏(以下称为游戏A)数据进行的分析. 作用: 1. 根据转移矩阵,可以对未来的WAU进行预测: 2. 查看”WAU用户构成”可以发现游戏的问题:新增过少?流失过多?忠诚用户过少? 概念解释: 这里所说的第N周,是往前推的第N周,如下图所示: 新增用户:注册时间在该周的用户. 本周回流用户:上周未登录游戏,本周有登录游戏的用户. 连续活跃N周的

同时开发两款H5的ARPG游戏的设计和实践

"-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 同时开发两款H5的ARPG游戏的设计和实践 - 弃天笑的程序世界 - 博客频道 - CSDN.NET 弃天笑的程序世界 专注于游戏开发.AS3.JavaScrirpt/TypeScript.Java服务端.持续集成,自动化流程 目录视图 摘要视图 订阅 [活动]2017 CS

游戏数据分析到底能做什么

被“妖魔化”的数据分析(摘) |字号 订阅 为什么说“被妖魔化”,因为新手总觉得数据分析是一件超级复杂,技术含量极高的事情.他们总关心一些专业词汇(arpu,pcu,还有很多我也不知道的英文字母组合),图表怎么做,excel工具怎么用,结论怎么写… 下面我说说我是怎么看数据分析的: 数据分析是一个方法,但不是唯一的方法 数据分析的优点是相对客观,但是缺点也很明显,人力和时间成本很高. 游戏里的数据分析无非就是要实现2个目的: 1.发现现存问题的本质,并解决他(99%)2.发现一些趋势,以便未来做

基于深度学习方法的dota2游戏数据分析与胜率预测(python3.6+keras框架实现)

很久以前就有想过使用深度学习模型来对dota2的对局数据进行建模分析,以便在英雄选择,出装方面有所指导,帮助自己提升天梯等级,但苦于找不到数据源,该计划搁置了很长时间.直到前些日子,看到社区有老哥提到说OpenDota网站(https://www.opendota.com/)提供有一整套的接口可以获取dota数据.通过浏览该网站,发现数据比较齐全,满足建模分析的需求,那就二话不说,开始干活. 这篇文章分为两大部分,第一部分为数据获取,第二部分为建模预测.   Part 1,数据获取 1.接口分析

零基础学习Python web开发、Python爬虫、Python数据分析,从基础到项目实战!

随着大数据和人工智能的发展,目前Python语言的上升趋势比较明显,而且由于Python语言简单易学,所以不少初学者往往也会选择Python作为入门语言. Python语言目前是IT行业内应用最为广泛的编程语言之一,尤其是近几年来随着大数据和人工智能(机器学习.自然语言处理.计算机视觉等)的发展,Python也得到了越来越广泛的应用,另外Python在Web开发.后端开发和嵌入式开发领域也有广泛的应用. 小编推荐一个学Python的学习裙,九三七六六七 五零九,无论你是大牛还是小白,是想转行还是

YY游戏私有云平台实践 (转BOSS的InfoQ发文 )

作者 风河 发布于 2016年1月13日 | 讨论 编者按:YY游戏的页游早在2013年就在云平台上运行,其Cloud 1.0已经支撑几十万的同时在线用户.日前,YY游戏云平台进行了Cloud 2.0的改造,其主要目标是支撑端游,同时也将继续服务页游.手游的运营. 这次架构升级是一次完全重构——抛弃OpenStack,网络.计算.存储业务都是自己实现.作为YY游戏云平台的负责人,风河在本文里主要描述了YY游戏需要建设一个什么样的云平台,以及如何建设这个云平台的. YY游戏的业务需求变迁 YY游戏

DirectX游戏开发——从一个小游戏开始

本系列文章由birdlove1987编写,转载请注明出处. 文章链接: http://blog.csdn.net/zhurui_idea/article/details/26364129 写在前面:自己对DirectX挺感兴趣的,加上自己目前在研究3D重建方面的东西,所以利用课余时间学习一下.看了一段时间的书,感觉还是靠动手编写一些小例子来学习,进步的更快体会的更深.所以从我自己写的一个小游戏开始吧,把自己学习心得和自己的一些想法写下来.更是欢迎有兴趣的童鞋来和我交流. 首先:先把我的小例子分享

Cocos2d-x手机游戏开发与项目实践详解_随书代码

Cocos2d-x手机游戏开发与项目实战详解_随书代码 作者:沈大海  由于原作者共享的资源为UTF-8字符编码,下载后解压在win下显示乱码或还出现文件不全问题,现完整整理,解决所有乱码问题,供大家下载. 下载地址:http://download.csdn.net/detail/oyangyufu/7665049 Cocos2d-x手机游戏开发与项目实践详解_随书代码