数组 array 矩阵 list 数据框 dataframe

转自： http://blog.csdn.net/u011253874/article/details/43115447

<span style="font-size:14px;">#R语言备忘录三#
#数组array和矩阵matrix、列表list、数据框dataframe
#数组
#数组的重要属性就是dim，维数
#得到4*5的矩阵
z <- 1:12
dim(z) <- c(3,4)
z
#构建数组
x <- array(1:20, dim = c(4,5))
#三维
y <- array(1:18, dim = c(2,3,3))
#数组下标
y[1, 2, 3]
#数组的广义转置,维度发生变化，把2维变成1维，把3维变成2维，把1维变成3维，即D[i,j,k] = C[j,k,i]
C <- array(1:24, dim = c(2,3,4))
D <- aperm(A, c(2,3,1))
#apply用于数组固定某一维度不变，进行计算
apply(A, 1, sum)
#矩阵
#产生矩阵
A <- matrix(1:15, nrow=3, ncol=5, byrow=TRUE)
B <- matrix(3:17, nrow=5, ncol=3, byrow=TRUE)
#求方阵行列式的值
det(matrix(1:4, ncol = 2))
#内积
#矩阵的内积
A %*% B
#也可以使用crossprod函数
crossprod(A, B)
crossprod(A)
#向量的外积，也叫叉积
x <- 1:5
y <- 2*1:5
x %o% y
#也可以使用tcrossprod函数、outer
outer(x, y)
tcrossprod(x)
#产生对角阵
#如果变量是一个向量，则是以向量为对角线元素的对角阵
v <- c(1, 3, 5)
diag(v)
#如果变量是一个矩阵，则是取矩阵对角线元素作为对角阵对角线元素
diag(A)
#解线性方程Ax=b，
b <- matrix(c(1,1,1), nrow = 3, byrow = TRUE)
B <- matrix(1:9, nrow = 3, byrow = TRUE)
solve(B,b)
#求矩阵的逆
solve(B)
#ev$values是特征根，ev$vectors是特征向量组成的矩阵
SM <- crossprod(A, A)
ev <- eigen(SM)
#奇异解,svd$d返回的是矩阵A的奇异值，svd$u则是正交阵U，svd$v对应的是正交阵V, A = UDVT
svdA <- svd(A)
#把矩阵拉成向量
as.vector(A)
#数组或矩阵的维的名字
X <- matrix(1:6, ncol = 2,
dimnames = list(c("one", "two", "three"), c("First", "Second")),
byrow = T)
#亦或是
dimnames(A) <- list(c("one", "two", "three"), c("First", "Second"))
colnames(A) <- c("First", "Second")
rownames(A) <- c("one", "two", "three")
#列表
#构建列表
Lst <- list(name="Fred", wife="Mary", no.children=3, child.ages=c(4,7,9))
#列表元素，列表名[[下标]]
Lst[[2]]
Lst[[4]][2]
#也可以使用名字代替下标
Lst[["name"]]
Lst$name
#修改列表
Lst$name <- c("John", "Tom")
#删除列表某项
Lst$name <- NULL
#连接几个列表
list.ABC <- c(list.A, list.B, list.C)
#数据框
#data.frame，用法和list相同，如果list里的成分满足数据框，也可以使用as.data.frame转换
df<-data.frame(
Name=c("Alice", "Becka", "James", "Jeffrey", "John"), Sex=c("F", "F", "M", "M", "M"),
Age=c(13, 13, 12, 13, 12),
Height=c(56.5, 65.3, 57.3, 62.5, 59.0)
Weight=c(84.0, 98.0, 83.0, 84.0, 99.5)
)
df
#矩阵可以通过data.frame(X)转换
#取数据框的一部分
df[1:2, 3:5]
df[["Height"]]
df$Weight
#命名
names(df)
rownames(df)
#attch()函数将数据框中的变量调入内存中，方便调用当中的数据
attach(df)
#取消连接
detach(df)
#调用edit进行编辑数据
edit(df)
#因子factor
sex <- c("M","M", "F","F")
sexf <- factor(sex)
#因子水平
sex_level <- levels(sexf)
#用table统计各类数据的频数
sex_tab <- table(sexf)
#用gl()产生因子
#gl(n, k, length = n * k, labels = 1:n, ordered = FALSE)
</span>

、、、、、、、、、、、、、、、、、、、、、、、、、、、

#R语言学习备忘录一#
#向量运算#
x <- c(1,2,3,6)
#不小于x的最小整数
ceiling(x)
#不大于x的最大整数
floor(x)
#向0方向截取的x中的整数
trunc(x)
#将x舍入为指定位的小数
round(x,digits=2)
#将x舍入指定的有效数字位数
signif(x,digits=2)
#三角函数
cos(x)
sin(x)
tan(x)
acos(x)
asin(x)
#分位数,如求25%及50%分位数
quantile(x,c(.25,.5))
#求值域
range(x)
#求乘积函数
prod(x)
#滞后差分
diff(x)
#求最大值和最小值对应的位置
which.min(x)
which.max(x)
#数据标准化
x<-c(123,232,212,232,120,273)
mydata<-scale(x)
mydata
#正则表达式匹配
str<-c("a","A","B","c")
grep("A",str,fixed=TRUE)
#字符
#分割符strsplit
strsplit("abcde","")
#连接字符paste
paste("x",1:10,sep="")
paste("x",1:5,sep="T")
paste("Today is ",date())
#大写转换toupper
toupper("abcEF")
#小写转换tolower
tolower("ABC")
#计算字符数量 nchar
x<-c("ab","deew","James")
nchar(x)
nchar(x[2])
#提取或替换一个数值，和Excel mid函数差不多 substr
x<-"abcdefg"
substr(x,2,5) #2到5个元素
substr(x,2,5)<-"1111111"
x
#注意两种等差数列的差别
1:n-1
1:(n-1)
#重复函数rep
y<-rep(1:5,2)
y
#等间隔函数
seq(-5, 5, by=.2)
seq(length=51, from=-5, by=.2)
#上下两种方式效果一样
#求行均值
apply(mydata,1,mean)
#求列均值
apply(mydata,2,mean)
#逻辑变量
#判断一个逻辑向量是否都为真的函数是all
all(c(1,2,3,4,5,6)>3)
#判断一个逻辑向量是否有为真的函数any
any(c(1,2,3,4,5,6)>3)
#缺失数据
#NA表示数据缺省或缺失
z <- c(1:3, NA)
z
a <- is.na(z)
#修改缺失数据
z[is.na(z)] <- 0
#is.nan()判断数据是否精确，inf也属于非精确
x <- c(0/1, 0/0, 1/0, NA)
is.nan(x)
is.finite(x)
is.infinite(x)
is.na(x)
#复数向量
#复数z=x+isin(x)
x <- seq(-pi, pi, by = pi/10)
y <- sin(x)
z <- complex(re = x, im = y)
plot(z)
lins(z)
#向量的下标运算
x <- c(1,4,7)
x[c(2,3)]
#修改元素值
x[c(1,3)] <- c(22, 33)
#逻辑向量
x <- c(1,4,7)
x < 5
x[x<5]
#分段函数
y <- numeric(length(x))
y[x<0] <- 1-x[x<0]
y[x>=0] <- 1-x[x>=0]
#即y=1-x,x<0; y=1+x,x>=0
#下标的负整数运算表示的是删除
v <- 10:20
v[-(1:5)]
#取字符串为下标
ages <- c(Li=33, Zhang=29, Liu=18)
ages["Zhang"]
#给向量赋予名字
fruit <- x(5, 10, 1, 29)
names(fruit) <- c("orange", "banana", "apple", "peach")

时间： 2024-11-05 18:57:29

数组 array 矩阵 list 数据框 dataframe的相关文章

R读书笔记一：变量，向量，数组，矩阵，数据框，读写文件，控制流

R读书笔记一:变量,向量,数组,矩阵,数据框,读写文件,控制流 1.创建向量和矩阵函数c( ), length( ), mode( ), rbind( ), cbind( ) 1)创建向量,求向量长度,向量类型. > x1=c(2,4,6,8,0) > x2=c(1,3,5,7,9) > length(x1) [1] 5 > mode(x1) [1] "numeric" > x1 [1] 2 4 6 8 0 > x1[3] [1] 6 > a

R 语言数据结构 --2 矩阵和数据框②数据框-dataframe

2018年6月11日晚,今天又中午没睡觉,但是还是不觉得困.也不觉得头疼,其实很多事情都是分人的.你不一定非要午睡,午睡是给早上干完活回寝室特别累的人,是视情况而定的,并不是每个人每天都要午睡的,很多事情养成了习惯反而是一种拖累,相反适时而动才是明智之举.比如早起早睡是好习惯,午睡如果下午会觉得头疼,就应该反思适不适合自己,很多事情也是这样.强迫自己并不好. 说多了,说回来,今天讲数据框dataframe 注意是data不是date.很重要!!!打错字哭都没用. 1dataframe的创建: 一

R语言实战-数据类型-2（数据框dataframe）

5.数据框dataframe data.frame 创建 data.frame() 1 > a<-c(1,2,3,4,5) 2 > b<-c('a','b','c','d','e') 3 > c<-c(T,F,F,F,T) 4 > x<-data.frame(a,b,c) 5 > x 6 a b c 7 1 1 a TRUE 8 2 2 b FALSE 9 3 3 c FALSE 10 4 4 d FALSE 11 5 5 e TRUE PS:子元素

Spark2 加载保存文件，数据文件转换成数据框dataframe

hadoop fs -put /home/wangxiao/data/ml/Affairs.csv /datafile/wangxiao/ hadoop fs -ls -R /datafile drwxr-xr-x - wangxiao supergroup 0 2016-10-15 10:46 /datafile/wangxiao -rw-r--r-- 3 wangxiao supergroup 16755 2016-10-15 10:46 /datafile/wangxiao/Affairs

Spark2加载保存文件，数据文件转换成数据框dataframe

R 语言数据结构 --2 矩阵和数据框①矩阵-matrix

矩阵-matrix-2018年6月9日今天很可惜,没有过多地学习R语言(主要因为去听了党课,学习了党重要讲话,所以没有看书),所以今天就总结一个矩阵吧.不过多的学习了. 首先稍微复习一下昨天的因子,首先要记得的就是mode()看每个元素,class()看整体是什么,另外如果你把TRUE abc 1都传给一个向量,那向量会把它进行类型转换.安全性:字符串>数字>逻辑值.会尽量向安全性高的转换.这个是隐式类型转换.当然也可以用as家族进行类型转化,例如将数字转换成字符串:as.character

pandas dataframe 数据框

数据框是一个二维数据结构,类似于SQL中的表格.借助字典,数组,列表和序列等可以构造数据框. 1.字典创建数据框,则列的名称为key的名称: d = {'one':pd.Series([1,2,3],index= ['a','b','c']), 'two':pd.Series([1,2,3,4],index=['a','b','c','d']) } print(pd.DataFrame(d)) 2.列表创建数据框: d = pd.DataFrame([[1,2,3,4],[5,6,7,8],[1

pandas模块学习之创建序列和数据框

import numpy as np import pandas as pd # 序列的创建,总共三种方式 #(1)一维数组创建 arr = np.arange(10) print(arr) print(type(arr)) s1 = pd.Series(arr) print(s1) print(type(s1)) print(s1[1]) #(2)字典的方式创建 dic = {'a':10,'b':20,'c':30,'d':40,'e':50} print(dic) print(type(d

R语言数组array函数

数组是一个可以在两个以上的维度存储数据的R数据对象.例如 - 如果创建尺寸(2,3,4)的数组,那么创建4个矩形矩阵每2行3列.数组只能存储数据类型. 使用 array()函数创建数组.它需要向量作为输入,并使用 dim 参数的值,以创建一个数组. 示例例子下面将创建的每两个3×3矩阵的数组,具有3行3列. # Create two vectors of different lengths. vector1 <- c(5,9,3) vector2 <- c(10,11,12,13,14,15