R基础学习

The Art of R Programming

1.seq
产生等差数列:seq(from,to,by) seq(from,to,length)
for(i in 1:length(x)) 当x为null时 i会依次取 1,0
for(i in seq(x)) 能避免x为null时产生错误。 seq(x) 会产生 1:length(x)的向量

2.rep
rep(x,n) x整体重复n次
rep(x,each=m) x的每个元素依次重复m次
rep(x,y) x中每个元素按照对于的y的元素重复 向量x与y的长度必须相等。

3.想要读写向量中的元素,必须对向量提前声明。因为R是函数式语言,读写都是通过函数来实现的,如果R事先不知道x是一向量,那么函数将没有执行的对象。

4.可以预先给向量分配内存空间,避免每次使用时重新分配,减慢代码运行速度。
for(i in seq(x)) r<-c(r,i) 每次调用都会给新的向量r分配内存
r<-vector(length=n) for(i in seq(x)) r[i]<-i 事先给r分配一个合适的内存大小,每次调用时就不用重新分配内存

5.cumsum(x) 计算向量x的累计和 结果向量的第i个元素是x的前i个元素的和。 cumulative sums

6. round(x) 四舍五入函数
floor(x) 向下取整

7.NA 存在但未知的值 na.rm=T 移除NA 未移除NA时,NA 作为存在的数,计算时会被计算在内。
NULL 不存在的值 R遇到NULL会主动跳过。

8.subset

9.which(x>2) 返回向量或矩阵x中符合条件的元素的索引,x如果是矩阵,则返回的是将x看成向量时符合条件的元素的位置。
which(x==2,arr.ind=T) 当x为矩阵时,返回的是符合条件的元素的行号和列号。

10.ifelse(a,x,y) a[i]为真时返回x[i],否则返回y[i]。x,y不够长时,自动补齐。

11.当对逻辑值T和F进行运算时,把T当做1,F当做0进行运算。

12.diff(x,k) 差分 错k位相减 :x[i+k]-x[i]

13.符号函数sign y<- sign(x) x的第i个元素为正,y[i]=1; x的第i个元素为负,y[i]=-1;x的第i个元素为0,y[i]=0

14. x<-1:4 产生的是整数;y<-c(1,2,3,4) 产生的是浮点数。 identical(x,y) FALSE identical用于判断两个对象是否完全相同(包括数据类型)
y<-c(1:4)产生的是整数

15.rbind(a,b) 将a,b按照行组合形成矩阵
cbind(a,b) 将a,b按照列组合形成矩阵
避免在循环中重复创建矩阵,每次进行矩阵内存分配将降低程序速度;应该一开始就定义一个大矩阵,在循环过程中逐行或逐列的进行赋值。

16.dim(x) x的维数 nrow(x)x的行数 ncol(x)x的列数

17.从矩阵中单独的取出一列或者一行时,结果的数据类型会变成向量。 a<-x[,3] a的类型为向量
为避免矩阵降维变成向量 a<-x[,3,drop=F] 强制转化成矩阵 as.matrix(x)
从数据框中取出一列时也会变成向量,取一行(元素数据类型不同时)会变成列表 a<-x[,3,drop=F]

18.a为一列表
a[2] 返回第二个组件,类型为列表 , a[1:4] 返回第1至第4个组件
a[[2]] 返回第二个组件,类型为第二个组件自身的类型 [[ ]] 每次只能取出一个组件

19. 删除列表组件时直接将其赋值为NULL
c(list1,list2,list3) 列表拼接
lenght(list4) 返回列表list4的组件个数

20.数据框会将字符向量默认为因子类型
a<-data.frame(name,age,stringsAsFactors=F)

21.merge(x,y,by.x=‘name‘,by.y=‘names‘)
合并数据库x,y,只有两个匹配列中完全相同的才会被显示。 by.x与by.y用于标示两个数据框中含有相同信息但是名称不同的两个匹配列。

22.substr(x,a,b) 截取x的第a位至第b位,结果为字符串。

23.split(x,f)
x为向量或者数据框,f为因子或者因子的列表。按照因子向量f对x进行分组,返回结果为列表。

24. by(x,factor,f)
类似于tapply ,但是此处x可以为矩阵或者数据框,f为需要多列数据的函数(如拟合)

25.table(x) x为因子向量或因子列表,统计各因子出现的次数

26.order(x) 对向量x进行排序,返回的是各元素在排序后的下标

27.cut(x,a) 按照x落在a是哪个区间上对x进行分类,生成因子。

28.next 结束当前的运行的一次循环(i=k),next后的语句不会执行;直接进入下一次循环(i=k+1)
break 直接跳出当前运行的这个循环体。

29.R不支持对非向量集合的循环
get(‘name‘) 接受一个代表对象名字的字符串参数,然后返回该对象的内容
将对象的名字组成向量用于for语句,在循环体内用get函数将由for语句中得到的对象名字转化为对象内容。
for(i in c(‘a‘,‘b‘,‘c‘) ) {
z<-get(i)
print( lm( z[,2]~z[,1] ) ) }

30. &,| 向量的逻辑运算,两个向量需要等长, 结果为一向量
&&,|| 标量的逻辑运算 当两个运算对象是向量时,只进行两个向量的第一个元素的逻辑预算作为结果

时间: 2024-10-04 16:49:00

R基础学习的相关文章

R基础学习(1):R概述

R是一个有着统计分析功能及强大作图功能的软件系统,是由Ross Ihaka和Robert Gentleman共同创立.它是属于GNU系统的一个自由.免费.源代码开放的软件,同时也是一个用于统计计算和统计制图的优秀工具. 一.R的发展历史 要说R,就不得不先来说一下S语言.1980年左右,AT&T贝尔实验室设计出一种在统计领域广泛使用的S语言.S语言是一种解释型语言,被设计用来进行数据探索.统计分析和作图. S语言最初的实现版本主要是S-PLUS,它是一个基于S语言的商业软件,由MathSoft公

R基础学习(二)-- 连接sqlserver

测试环境:win10+RStudio 三个步骤:(1)创建ODBC数据源:(2)install.packages('RODBC') :(3)编写连接测试脚本 (1)创建ODBC数据源 控制面板->系统和安全->管理工具->ODBC数据源(64位)->系统DSN,点击添加按钮, 接着选择安装数据源驱动程序 SQL Server,点击完成 填写名称和服务器,名称用于R连接需要用到的database,比如这里填入myData, sqlserver的服务器名可以在登陆sqlserver的可

R基础学习(三)-- 简单练习(shiny+mysql+barplot)

测试环境:win10+RStudio 提前准备: install.packages('shiny') install.packages('RMySQL') 数据表准备: 最终实现的界面效果如下:点击[Click Me]按钮,从数据库读出数据,并在界面画出条形图 正式开始! 在R项目(比如ShinyDemo)的目录下新建一个文件夹barplotDemo 然后在这个目录下新建两个文件,ui.R和server.R ui.R的代码实现如下 library(shiny) # Use a fluid Boo

R语言学习-基础篇1

###第一周:R基础 rm(list = ls())  #ctr+L###矩阵相乘,函数diag()a=matrix(1:12,nrow=3,ncol=4)b=matrix(1:12,nrow=4,ncol=3)a%*%ba=matrix(1:16,nrow=4,ncol=4)diag(a)#返回对角线元素diag(diag(a))diag(4)#对角线为1的单位矩阵###矩阵求逆,函数rnorm(),solve()a=matrix(rnorm(16),4,4)#产生4*4的随机数solve(a

Linux shell脚本基础学习详细介绍(完整版)一

Linux shell脚本基础学习这里我们先来第一讲,介绍shell的语法基础,开头.注释.变量和 环境变量,向大家做一个基础的介绍,虽然不涉及具体东西,但是打好基础是以后学习轻松地前提.1. Linux 脚本编写基础◆1.1 语法基本介绍 1.1.1 开头 程序必须以下面的行开始(必须方在文件的第一行): #!/bin/sh 符号#!用来告诉系统它后面的参数是用来执行该文件的程序.在这个例子中我们使用/bin/sh来执行程序. 当编辑好脚本时,如果要执行该脚本,还必须使其可执行. 要使脚本可执

Docker 学习笔记【2】 Docker 基础操作实,Docker仓库、数据卷,网络基础学习

Docker 学习笔记[3] Docker 仓库实操,创建私有仓库,实操数据卷.数据卷容器,实操 网络基础  ---------高级网络配置和部分实战案例学习 ============================================================= Docker 学习笔记[1]Docker 相关概念,基本操作--------实操记录开始 ============================================================= 被

R语言学习路线图-转帖

本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等. 1.初级入门 <An Introduction to R>,这是官方的入门小册子.其有中文版,由丁国徽翻译,译名为<R导论>.<R4Beginners>,这本小册子有中文版应该叫<R入门>.除此之外,还可以去读刘思喆的<153分钟学会R>. 这本书收集了R初学者提问频率最高的153个问题.为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题

【Linux】鸟哥的Linux私房菜基础学习篇整理(一)

最近,一直在写PPC的模拟器和汇编器,也在做设计.所以重新看了看<鸟哥的Linux私房菜>,还是有好多命令不太熟悉.就打算写几篇blog记下来. 1. nl [-bnw] filename:添加行号打印参数:-b:指定行号指定的方式,主要有两种: -b a:表示不论是否为空行,也同样列出行号(类似cat -n): -b t:如果有空行,空的那一行不要列出行号(默认值).-n:列出行号表示的方法,主要有三种: -n ln:行号在屏幕的最左方显示: -n rn:行号在自己字段的最右方显示,且不加0

Python 基础学习 网络小爬虫

<span style="font-size:18px;"># # 百度贴吧图片网络小爬虫 # import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imgli