用R语言分析詹姆斯的客场得分

  篮球小皇帝——勒布朗·詹姆斯(LeBron James), 1984年12月30日出生在美国·俄亥俄州·阿克伦,美国男子职业篮球运动员,司职小前锋,现效力于克利夫兰骑士队。

  勒布朗·詹姆斯在2003年的NBA选秀大会中,首轮第一顺位被克利夫兰骑士队选中。2003-2010年,詹姆斯在骑士队效力7年,期间获得两届NBA最有价值球员(MVP)。2010年转会至迈阿密热火队,与德怀恩·韦德、克里斯·波什组成“三巨头”阵容。

  现在,用R语言来分析詹姆斯(LBJ)与哪个球队相遇时,表现得最好。先用地图来标出,NBA 30支球队的地理分布,如图(1)所示。  

图(1) NBA 30支球队的地理分布

  球队的简称:

   图(2) 球队的简称

  球队所在的城市和分区:

   图(3) 球队所在的城市和分区

   首先,我们要收集原始数据,其中包含3个变量: Opp、AvgPTS、state。

   Opp表示对手的球队名称;AvgPTS为詹姆斯对阵该队时的平均得分;state表示球队所在的州,各州的名称必须与R中内置的美国地图信息保持一致,美国地图的数据信息通过函数map_data()获取。

   另外,由于NBA球队并不是遍布每一个州,对于没有球队的州,我们将对应的AvgPTS赋值为0,这样绘制图形时就会以灰色区域表示了。

  数据源保存在lbj.txt中。

  //lbj.txt  

Opp AvgPTS  state
ATL 21.75   georgia
BOS 29.25   massachusetts
BRK 21.67   ‘new york‘
CHA 30  ‘north carolina‘
CHI 28  illinois
CLE 27.67   ohio
DAL 28  texas
DEN 23.5    colorado
DET 29  michigan
GSW 28  california
HOU 35  texas
IND 21  indiana
LAC 30  california
LAL 35.5    california
MEM 19  tennessee
MIL 27.5    wisconsin
MIN 21  minnesota
NOH 30  louisiana
NYK 27.67   ‘new york‘
OKC 34  oklahoma
ORL 28.67   florida
PHI 23.75   pennsylvania
PHO 22  arizona
POR 22.5    oregon
SAC 30  california
SAS 23  texas
UTA 31  utah
WAS 24.33   washington
NA  0   alabama
NA  0   arkansas
NA  0   connecticut
NA  0   delaware
NA  0   ‘district of columbia‘
NA  0   idaho
NA  0   iowa
NA  0   kansas
NA  0   kentucky
NA  0   maine
NA  0   maryland
NA  0   mississippi
NA  0   missouri
NA  0   montana
NA  0   nebraska
NA  0   nevada
NA  0   ‘new hampshire‘
NA  0   ‘new jersey‘
NA  0   ‘new mexico‘
NA  0   ‘north dakota‘
NA  0   ‘rhode island‘
NA  0   ‘south carolina‘
NA  0   ‘south dakota‘
NA  0   vermont
NA  0   virginia
NA  0   ‘west virginia‘
NA  0   wyoming

  使用软件R3.2.5+RStudio-0.99.893,进行分析,代码如下:

  //deifen.R  

library(ggplot2)
lbj <- read.table("G:/myProject/RDoc/Unit2/rChap6/lbj.txt",header = T,quote = "‘")
attach(lbj)
##查看数据前5行
head(lbj)
##获取美国地图信息
state_map <- map_data("state")

p=ggplot(lbj,aes(map_id=state))+geom_map(aes(fill=AvgPTS),map=state_map)+
  expand_limits(x=state_map$long,y=state_map$lat)+
  scale_fill_continuous(limits=c(19,max(AvgPTS)),high=‘red3‘,low=‘yellow‘,guide="colorbar")+
  labs(title=‘詹姆斯客场平均得分‘)

attach(state_map)
state.uni=unique(region)  #存放各州的名称
xx=0;yy=0  #事先建立变量xx和yy,下面用循环找到每个州对应的坐标值
for(i in 1:length(state.uni))
{
  xx[i]=mean(long[region==state.uni[i]])
  yy[i]=mean(lat[region==state.uni[i]])
}

order=0  #按变量state.uni的顺序找到数据集lbj中各州的位置,存放于变量order
for(i in 1:length(state.uni)){
  order[i]=which(state==state.uni[i])
}
labels=Opp[order]  #通过位置找到各州对应的球队名称
p+annotate("text",x=xx,y=yy,label=labels)  #最后绘图并添加注释

  效果如下:  

图(4) 詹姆斯的客场得分

  在图(4)中,颜色从黄到红,由浅到深,表示得分从小到大增长,颜色越红表示得分越高,颜色越淡表示得分越低。詹姆斯在遇到OKC(俄克拉马雷霆队)时,颜色很红,代表得分很高,说明詹姆斯对OKC的克制作用很大。

时间: 2024-08-30 00:24:54

用R语言分析詹姆斯的客场得分的相关文章

用R语言分析我的fitbit计步数据

目标:把fitbit的每日运动记录导入到R语言中进行分析,画出统计图表来 已有原始数据:fitbit2014年每日的记录电子表格文件,示例如下: 日期 消耗卡路里数 步 距离 攀爬楼层数 久坐不动的分钟数 不太活跃分钟数 中度活跃分钟数 非常活跃分钟数 2014年4月27日 2736 16581 11.84 7 1111 131 117 81 2014年4月28日 2514 12622 9.01 6 910 136 59 76 2014年4月29日 2231 8357 5.97 9 1208 1

R语言分析(一)-----基本语法

  一, R语言所处理的工作层: 解释一下: 最下面的一层为数据源,往上是数据仓库层,往上是数据探索层,包括统计分析,统计查询,还有就是报告 再往上的三层,分别是数据挖掘,数据展现和数据决策. 由上图可知,R语言是可以用于数据挖掘,数据展现,而后领导根据展现的数据来决策,R语言在数据展现的方面,拥有很强大的功能. 二,R语言的数据结构: 包括如下的几项:包括向量,矩阵,数组,数据框,列表和因子 1,向量: 创建向量的方法一共有三种,分别如下: 第一种,使用c()的这个方法: 由于博客中木有R语言

R语言分析nginx日志

nginx日志举例 172.16.1.1 - - [04/Feb/2015:23:40:01 +0800] "POST /api/message/query HTTP/1.1" 200 52 "-" "Apache-HttpClient/4.2 (java 1.5)" "-" "message.test.com" "172.16.3.159" "-" "0.

R语言分析南京房价

**################################################# 本项目分析南京房价数据,数据来源:链家网 autho:owl 前言:本文利用网上爬取的南京二手房信息,利用R进行简单分析,数据做仅学习研究练习用,侵删 首先读取数据,数据为.csv格式 houseprice = read.csv("E:/houseprice.csv",stringsAsFactors = F) View(head(houseprice,30)) str(housep

用R语言分析《我是歌手》出场顺序与名次的关系

上周<我是歌手>吵吵闹闹地落幕了,这一季是我最关注的一季,很认真的从头看到尾.网上各种讨论,特别反感那些说看到谁谁谁就不想看了的说法,其实单纯地去听他们的歌声,会觉得即使是之前不看好的那些歌手都能给你很多惊喜和感动.以前对清华哥哥的印象是歌都很好听,但是自己唱不红,翻唱都会变红啊,现在喜欢上他的声音了啊!不管这个节目有没有什么内部操作黑幕,单纯听他们的歌还是挺好的.当然,这篇文章的主旨不在此,我们要看的如题<我是歌手>节目中,出场顺序和名词的关系.关系肯定是有的,节目里自己都说到了

R语言分析(二)——薛毅R语言第二章后面习题解析

包括2.2—2.6中间的习题,2.2的习题中第三问和第四问,应该有其他的解答方法,但我看他的题目,似乎是在A和B的基础上进行,所以就选择了使用for循环的方法 做着习题,又不断查着书,这样,书籍也熟悉了,习题也做完了,感觉特别爽的还是... 解答:上面题目中第二小问是个错误的,改写成D=A ,才有下面的答案 (1)(2)(3): (4): (5): 2.3题答案: 2.4题答案: 2.5题的答案: 完成的答案如下图所示: 1,生成纯文本和csv,并读取 2,使用excel打开生成的csv

R语言重要数据集分析研究——需要整理分析阐明理念

1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标,常用的如下:最小值,最大值,四分位数,均值,中位数,众数,方差,标准差,极差,偏度,峰度 先来解释一下各个量得含义,浅显就不说了,这里主要说一下不常见的 众数:出现次数最多的 方差:每个样本值与均值的差得平方和的平均数 标准差:又称均方差,是方差的二次方根,用来衡量一个数据集的集中性 极差:最大值

大数据时代的精准数据挖掘——使用R语言

老师简介: Gino老师,即将步入不惑之年,早年获得名校数学与应用数学专业学士和统计学专业硕士,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学.统计和计算机功底强悍. 曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的效果. Gino老师担任数据分析培训师多年,探索出一套以实例讲解带动统计原理理解和软件操作熟悉的方法,授课的学生能迅速理解统计原理并使用统计软件独立开展数

R语言矩阵维度“消失”的问题

矩阵(matrix)是R语言中很基础的一种数据结构,也是R语言使用者经常使用的一种数据结构.矩阵的维度一般为二维(m*n). R语言中矩阵的操作是非常简单易懂的,但是在对R语言做矩阵操作时,有个地方需要特别注意.下面我们通过一个例子说明. 首先,我们创建一个用于测试的矩阵. test1 <- matrix(data = c(1:6), nrow = 3, ncol = 2, dimnames = list(c("row1", "row2", "row