R笔记 2

视频笔记

随手记,仅供个人查阅

1.  kaggle比赛

2.  发布结果的平台:GitHub,RPubs

3.  发布文件 README.md:introduction(dataset, variables...), loading the data, making plots

4.  Google,Stackoverflow 搜索R问题

5.  提问:操作系统,R版本,函数,错误,语句

6.  因子:改变因子levels顺序用factor里levels参数

table函数查看因子各个数

unclass()去掉因子属性,得到整型变量

7.  NaN属于NA,NA不属于NaN;   NaN有类型属性,可以有character NaN

8.  Sys.Date()获得当前年月日,类型是data;   julian()获得当前距1970.1.1的天数

9.  names(unclass(变量))

10.构造子集:subset(向量矩阵,条件)

11.[]获得列表元素包含名字和内容;   [[]]获得列表元素的内容

12.[[c(1,2)]]表示获取列表第一个元素里第二个元素

13.不完全匹配:$获取子集时,元素名可以不写完全 a <-    list(adsff=1:10) a$a可得到1:10

[[]]获取子集时,不完全匹配需要加上exact参数 a[["a", exact=FALSE]] 否则得到NULL

若是两个元素名中都有a,则会返回NULL

14.返回两个向量都不为缺失值的位置:complete.cases(x,y) xy都为向量 ()中或为数据框之类

15.apply(数组,维数,函数名)        x <- matrix(rnorm(100),10,10);apply(x,1,quantlile, probs=c(0.25,0.75))

16.x <- 1:4; lapply(x, runif, min=0, max=100)    产生一个列表包含四个元素,每个元素里有1,2,3,4个元素

17.x <- list(a=matrix(1:6,2,3), b=matrix(4:7,2,2));lapply(x, function(m) m[1, ] )

lapply与匿名函数的结合,提取列表x中每个矩阵元素第一行

18.sapply简化结果:结果列表元素长度均为1,返回向量;长度相同且大于1,返回矩阵;否则仍为列

19.mapply(函数名,数据,函数相关参数)      list(seq(1,4),seq(2,3),seq(3,2),seq(4,1)) 与 mapply(seq,1:4,4:1)结果一致

20.tapply(向量,因子,函数名) x <- c(rnorm(5), runif(5), rnorm(5,1));f <- gl(3,5)(产生因子)

tapply(x, f, mean) 参数simplify=FALSE拒绝简化

21.split 根据因子对向量数组等分组 x <- c(rnorm(5), runif(5), rnorm(5,1));f <- gl(3,5)

split(x,f) lapply(split(x,f), mean)

22.s <- split(airquality.airquality$Month) ; table(airquality$Month)

lapply(s, function(x) colMeans(x[,c("Ozone", "Wind", "Temp")]))

sapply(s, function(x) colMeans(x[,c("Ozone", "Wind", "Temp"), na.rm=TTRUE))

时间: 2024-08-03 15:27:23

R笔记 2的相关文章

R 笔记

(1) > x = 11> x[1] 11> print(x)[1] 11> y <- 7> ls()[1] "x" "y"> rm(y)> y <- 9> x1 = c(1,3,5,7,9)> x1[1] 1 3 5 7 9> sqrt(y)[1] 3> log(y)[1] 2.197225> log2(y)[1] 3.169925> exp(y)[1] 8103.084 &

R 笔记(2)

incomplete final line found by... The message indicates that the last line of the file doesn't end with an End Of Line (EOL) character (linefeed (\n) or carriage return+linefeed (\r\n)). The original intention of this message was to warn you that the

【R笔记】日期处理

R语言学习笔记:日期处理 1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed Oct 29 20:36:07 2014" 2.在R中日期实际是double类型,是从1970年1月1日以来的天数 typeof(Sys.Date()) [1] "double" 3.转换为日期 用as.Date()可以将一个字符串转换为日期值,默认格式是yyyy-mm-dd. a

【R笔记】R的内存管理和垃圾清理

R输入命令时速度不要太快,终究是个统计软件,不是编程! 写R程序的人,相信都会遇到过“cannot allocate vector of size”或者“无法分配大小为...的矢量”这样的错误.原因很简单,基本都是产生一个大矩阵等对象时发生的,最干脆的解决办法有两种,第一种是加大内存换64位系统,第二种是改变算法避免如此大的对象.第一种办法,是最好的办法,不过大对象的需求是没有止尽的,终究不是长久之道.第二种办法是最好的思路,无论多么大的对象都是可以弄小的,无非就是分而治之.时间换空间等,对算法

【R笔记】使用R语言进行异常检测

本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局部异常因子)进行异常检测 (3)通过聚类进行异常检测 (4)对时间序列进行异常检测 一.单变量异常检测 本部分展示了一个单变量异常检测的例子,并且演示了如何将这种方法应用在多元数据上.在该例中,单变量异常检测通过boxplot.stats()函数实现,并且返回产生箱线图的统计量.在返回的结果中,有一个部分是o

【R笔记】glm函数报错原因及解析

R语言glm函数学习:  [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(formula, family=family.generator, data,control = list(...)) family:每一种响应分布(指数分布族)允许各种关联函数将均值和线性预测器关联起来. 常用的family: binomal(link='logit')         ----响应变量

【R笔记】给R加个编译器——notepad++

R的日记-给R加个编译器 转载▼ R是一款强大免费且开源的统计分析软件,这是R的长处,可也是其“缺陷”的根源:不似商业软件那样user-friendly.记得初学R时,给我留下最深印象的不是其功能的强大(体会到的其实是),而是其简洁如一张白纸的操作界面,再加上复杂而劳累的一遍遍敲击键盘,感觉用其做一点点统计分析都是噩梦.时至今日,R的编译界面,我依然觉得是用过的软件中最烂的那类.一个这么好的软件为什么就不做一个好用的界面呢? 幸运的是,到目前已经有好几个第三方的编译器可以和R联接.用这些编译器有

R笔记 1

搜索笔记 pchisq(q, df) #求卡方对应p值,q为统计量值 qchisq(1-alpha,df) #求卡方1-alpha对应值 data() #查看R的内置数据集 methods() #可以查看面向式函数所有函数,例methods(plot)<br> (.packages()) #查看环境中包 detach(package:~) #移除加载的包<br> .packages(all.available=T) #查看下载的包 options(max.print = 20000

R笔记1

swirl安装课程命令:install_from_swirl("Data_Analysis") <2:workspace and files>1.getwd():显示当前工作空间路径;例子:old.dir <- getwd()将当前工作路径赋给old.dir变量;2.ls():列出当前工作空间里的所有对象(变量);3.dir():列出当前工作空间文件文件夹内所有文件和文件夹;4.list.files():与dir()函数作用一样;5.args():查看某函数所需的变量