如何使用R进行数据展现?且看使用iris数据可视化实例

iris数据的详细介绍如下:

首先,要查看iris数据集的大小和结构,其维度和名称分别使用函数dim 和names获取,函数str 和attributes返回数据的结构和属性。

dim(iris)

names(iris)

str(iris)

attributes(iris)

接下来,查看数据的前五行,返回第一和最后一行,使用head和tail

iris[1:5,]

head(iris)

tail(iris)

还可以查找某一列的值:

例如,下面的两行代码可用来获取到Sepal.Length的前10个值。

iris[1:10, "Sepal.Length"]

iris$Sepal.Length[1:10]

每一个数值型变量的分布情况,可用函数summary进行查看。该函数的返回值是变量中的最小值、最大值、平均值、中位数、第一四分位数(25%)和第三四分位数(75%)。

对于因子(或分类变量)而言,函数返回的是每一个等级水平的频数。

summary(iris)

平均值、中位数和极差也可以分别使用函数mean、median和range获取,获取四分位数和百分位数可以使用quantile函数,代码如下所示:

quantile(iris$Sepal.Length)

quantile(iris$Sepal.Length, c(.1, .3, .65))

接下来,使用函数var查看Sepal.Length的方差,使用hist绘制分布直方图,使用函数density计算密度估计值。

var(iris$Sepal.Length)

hist(iris$Sepal.Length)

密度图

plot(density(iris$Sepal.Length))

饼图

因子的频数可以由函数table计算,然后使用函数pie绘制饼图,绘制条形图。或使用函数barplot绘制条形图。

table(iris$Species)

pie(table(iris$Species))

条形图

barplot(table(iris$Species))

查看了单个变量的分布后,还需要展现两个变量之间的关系。下面使用函数cov和cor 分别计算变量之间的协方差和相关系数。

cov(iris$Sepal.Length, iris$Petal.Length)

cov(iris[,1:4])

cor(iris$Sepal.Length, iris$Petal.Length)

cor(iris[,1:4])

接下来,使用函数aggregate计算每一个鸢尾花种(species)的sepal.Lellgth的统计数据。

aggregate(Sepal.Length ~ Species, summary, data=iris)

然后,使用函数boxplot绘制盒图(又称为盒形-虚线图),以展示数据分布的中位数、第一四分位数和第三四分位数(即累积分布中的位于50%、25%、75%位置上的点),以及离群点。

盒图中间的横线表示中位数。图示四分位差(IQR),即第三四分位数(75%)与第一四分位数(25%)的差值。

boxplot(Sepal.Length~Species, data=iris)

时间: 2024-08-23 18:01:32

如何使用R进行数据展现?且看使用iris数据可视化实例的相关文章

R语言randomForest包实现随机森林——iris数据集和kyphosis数据集

library(randomForest)model.forest<-randomForest(Species~.,data=iris)pre.forest<-predict(model.forest,iris)table(pre.forest,iris$Species) library(rpart)library(randomForest)model.forest<-randomForest(Kyphosis~.,data=kyphosis)pre.forest<-predict

透过现象看本质 大数据核心并不在规模大

透过现象看本质 大数据核心并不在规模大谆籽做谞谞诅资祝仔渍庄昨赚缀阻透过现象看本质 大数据核心并不在规模大 http://www.songtaste.com/user/10226369/info http://www.songtaste.com/user/10226373/info http://www.songtaste.com/user/10226374/info http://www.songtaste.com/user/10226382/info http://www.songtaste

SharePoint列表数据展现方法

方法1: Guid guid = new Guid ("{8238B046-EC5F-46B6-8E18-028F77EC2620}"); SPSite Asite = new SPSite ("http://mosslt/"); SPList list = Asite.RootWeb.Lists[guid]; SPQuery query = new SPQuery(); query.Query = @"<OrderBy> <FieldR

大数据,只看这个就够了

2016年5月25日上午,由贵州省政府举办的以"大数据开启智能时代"为主题的中国大数据产业峰会在贵阳开幕,国务院总理李克强发表主旨演讲.腾讯集团马化腾,高通公司总裁Derek Aberle,百度公司李彦宏,微软全球陆奇,京东集团刘强东,阿里巴巴王坚,滴滴出行程维,HTC王雪红,戴尔Michael Dell等重要嘉宾出席会议并发言.至此,大数据发展已经上升到国家战略层次,其热度可见一斑.如图一为李克强总理发表讲话: 图一 自2016年起,大数据与人工智能,虚拟现实相继重新进入了我们的视线

Build2016上值得一看的大数据相关Session

(此文章同时发表在本人微信公众号"dotNET每日精华文章",欢迎右边二维码来关注.) 题记:Build2016开完很久了,现在才来回顾下,就说说那些和大数据相关的Session,也因为笔者最近在深入研究这方面的东西. 3月30日到4月1日的Build2016 微软开发者大会的内容引爆了整个.NET开发社区,大家的热情都被Xamarin免费开源.Bash on Windows等点燃了.不过在这些热点背后,我还是比较关注和自己最近研究的大数据领域相关的Session.下面我就整理一些我个

Struts2 数据展现

Struts2 数据展现 一.OGNL 什么是GONL? Object Graph Navigation Language,是一门功能强大的表达式语言,类似于EL. Struts2默认采用OGNL表达式访问Action的数据,通过ValueStack用封装后的OGNL来访问Action. OGNL是独立的开源组件,Struts2对其进行了改造及封装,要想了解Struts2中OGNL的运行原理,需参考ValueStack. Struts2显示标签 Struts2中,OGNL表达式要结合Struts

看懂大数据的技术生态圈 Hadoop,hive,spark(转载)

先给出原文链接: 原文链接 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的.你可以把它比作一个厨房所以需要的各种工具.锅碗瓢盆,各有各的用处,互相之间又有重合.你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮.但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择. 大数据,首先你要能存的下大数据. 传统的文件系统是单机的,不能横跨不同的机器.HDFS(Hadoop Distributed File System

一文看懂大数据的技术生态圈

大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的.你可以把它比作一个厨房所以需要的各种工具.锅碗瓢盆,各有各的用处,互相之间又有重合.你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮.但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择. 大数据,首先你要能存的下大数据. 传统的文件系统是单机的,不能横跨不同的机器.HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据

C#.NET 大型通用信息化系统集成快速开发平台 4.1 版本 - 主管可以看下属的数据

主管可以看下属的数据,这个是经常用到的一个权限,不管是大公司,还是小公司都需要的功能. 通过以下2个方法,可以任意达到想要的效果了,设置简单灵活,还能递归运算下属,有时候简单好用就是硬道理. #region public List<BaseUserEntity> public List<BaseUserEntity> GetListByManager(BaseUserInfo userInfo, string managerId) 按上级主管获取下属用户列表 /// <sum