R语言数据操作之apply系列

 1 ###################R语言中apply类型问题

 2 data<-data.frame(x=c(1,2,3,4),y=c(2,3,4,5),z=c(5,6,7,8))

 3 apply(data,2,mean)##apply针对数据框

 4 lapply(data,mean)##lapply针对list，当然对dataframe也有效

 5 data1<-list(a=1:10,b=exp(-3:3),c=c(FALSE,FALSE,FALSE))

 6 lapply(data1，mean)##list中每个变量的长度可以是不同的

 7 sapply(data1,mean,simplify=T)

 8 #另外，还有一个vapply，里面有一个参数FUN.VALUE，对返回的结果进行检验，如果不符合要求，则会报错

 9 #tapply

10 data2<-data.frame(x=c("F","F","M","M","F"),y=c(172,176,166,188,190,163))

11 tapply(data2$y,data2$x,mean,simplify=T)##分组统计的功能,simplify为TRUE，则以列表的形式返回,FALSE则直接返回数值

12 #aggregate函数,,,分类汇总

13 attach（mtcars）

14 aggregate(mtcars,by=list(cyl,gear),FUN=mean)

R语言数据操作之apply系列

时间： 2024-08-26 18:38:09

R语言数据操作之apply系列的相关文章

《美团 R 语言数据运营实战》

美团 R 语言数据运营实战 2018年08月02日作者: 喻灿刘强文章链接 3689字 8分钟阅读一.引言近年来,随着分布式数据处理技术的不断革新,Hive.Spark.Kylin.Impala.Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益成为各类企业和机构的标配.在这种背景下,是否能探索和挖掘数据价值,具备精细化数据运营的能力,就成为判定一个数据团队成功与否的关键. 在数据从后台走向前台的过程中,数据展示是最后一步关键环节.与冰冷的表

第二篇：R语言数据可视化之数据塑形技术

前言绘制统计图形时,半数以上的时间会花在调用绘图命令之前的数据塑型操作上.因为在把数据送进绘图函数前,还得将数据框转换为适当格式才行. 本文将给出使用R语言进行数据塑型的一些基本的技巧,更多技术细节推荐参考<R语言核心手册>. 数据框塑型 1. 创建数据框 - data.frame() # 创建向量p p = c("A", "B", "C") # 创建向量q q = 1:3 # 创建数据框:含p/q两列 dat = data.fra

第四篇：R语言数据可视化之折线图、堆积图、堆积面积图

前言折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴. 但横轴也不一定是连续型变量,可以是有序的离散型变量. 绘制基本折线图本例选用如下测试数据集: 绘制方法是首先调用ggplot函数选定数据集,并在aes参数中指明横轴纵轴.然后调用条形图函数geom_line()便可绘制出基本折线图.R语言示例代码如下: # 基函数 ggplot(BOD, aes(x = Time, y = demand)) + # 折线图函数 geom_line() 运行结果: 向折线

R语言-基础操作

今天Mayuyu来学习R语言,先来学习一些基础的操作. (1)c() c()是用来创建一个向量,比如 (2)length() length()用来获取一个向量的长度. (3)mode() 获取向量中数据的类型,比如 (4)rbind()和cbind() 这两个函数都是将多个向量合并为一个矩阵,或者将多个矩阵合并为一个矩阵,rbind()是按照行合并, 而cbind()是按照列合并. (5)mean() 求平均值. (6)sum() 求和. (7)min()和max() 分别求最小值和最大值. (

R语言数据可视化之散点图

散点图简介散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本. 同时散点图中常常还会拟合一些直线,以用来表示某些模型. 回到顶部绘制基本散点图本例选用如下测试数据集: 绘制方法是首先调用ggplot函数选定数据集,并在aes参数中指明横轴纵轴.然后调用散点图函数geom_point()便可绘制出基本散点图.R语言示例代码如下: 1 2 3 4 # 基函数 ggplot(ah, aes(x = ageYear, y = heightIn)) + # 散点图

第三篇：R语言数据可视化之条形图

条形图简介数据可视化中,最常用的图非条形图莫属,它主要用来展示不同分类(横轴)下某个数值型变量(纵轴)的取值.其中有两点要重点注意: 1. 条形图横轴上的数据是离散而非连续的.比如想展示两商品的价格随时间变化的走势,则不能用条形图,因为时间变量是连续的: 2. 有时条形图的值表示数值本身,但也有时是表示数据集中的频数,不要引起混淆: 绘制基本条形图本例选用测试数据集如下: 绘制方法是首先调用ggplot函数选定数据集,并在aes参数中指明横轴纵轴.然后调用条形图函数geom_bar(stat

第五篇：R语言数据可视化之散点图

散点图简介散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本. 同时散点图中常常还会拟合一些直线,以用来表示某些模型. 绘制基本散点图本例选用如下测试数据集: 绘制方法是首先调用ggplot函数选定数据集,并在aes参数中指明横轴纵轴.然后调用散点图函数geom_point()便可绘制出基本散点图.R语言示例代码如下: # 基函数 ggplot(ah, aes(x = ageYear, y = heightIn)) + # 散点图函数 geom_point()

R语言数据合并使用merge数据追加使用rbind和cbind

R语言中的横向数据合并merge及纵向数据合并rbind的使用我们经常会遇到两个数据框拥有相同的时间或观测值,但这些列却不尽相同.处理的办法就是使用merge(x, y ,by.x = ,by.y = ,all = ) 函数. #合并ID<-c(1,2,3,4)name<-c("A","B","C","D")score<-c(60,70,80,90)student1<-data.frame(ID,na

R语言数据去重

R语言常用的去重命令有unique duplicated unique主要是返回一个把重复元素或行给删除的向量.数据框或数组 > x <- c(3:5, 11:8, 8 + 0:5)> x [1] 3 4 5 11 10 9 8 8 9 10 11 12 13> unique(x)[1] 3 4 5 11 10 9 8 12 13> unique(x, fromLast = TRUE)[1] 3 4 5 8 9 10 11 12 13