R与数据分析旧笔记(一)基本数学函数的使用

  • 创建向量矩阵

> x1=c(2,3,6,8)
> x2=c(1,2,3,4)
> a1=(1:100)
> length(a1)
[1] 100
> length(x1)
[1] 4
> mode(x1)
[1] "numeric"
> rbind(x1,x2)
   [,1] [,2] [,3] [,4]
x1    2    3    6    8
x2    1    2    3    4
> cbind(x1,x2)
     x1 x2
[1,]  2  1
[2,]  3  2
[3,]  6  3
[4,]  8  4
  • 求平均值,和,连乘,最值,方差,标准差

> mean(x1)
[1] 4.75
> sum(x1)
[1] 19
> max(x1)
[1] 8
> min(x1)
[1] 2
> var(x1)
[1] 7.583333
> prod(x1)
[1] 288
> sd(x1)
[1] 2.753785
  • 产生向量

> 1:10
 [1]  1  2  3  4  5  6  7  8  9 10
> 1:10-1
 [1] 0 1 2 3 4 5 6 7 8 9
> 1:10*2
 [1]  2  4  6  8 10 12 14 16 18 20
> a=2:60*2+1
> a
 [1]   5   7   9  11  13  15  17  19  21  23  25  27  29  31  33  35  37  39  41
[20]  43  45  47  49  51  53  55  57  59  61  63  65  67  69  71  73  75  77  79
[39]  81  83  85  87  89  91  93  95  97  99 101 103 105 107 109 111 113 115 117
[58] 119 121
> a[5]
[1] 13
> a[-5]
 [1]   5   7   9  11  15  17  19  21  23  25  27  29  31  33  35  37  39  41  43
[20]  45  47  49  51  53  55  57  59  61  63  65  67  69  71  73  75  77  79  81
[39]  83  85  87  89  91  93  95  97  99 101 103 105 107 109 111 113 115 117 119
[58] 121
> a[c(2,3,8)]
[1]  7  9 19
> a[a<20]
[1]  5  7  9 11 13 15 17 19
> a[a[3]]
[1] 21
> seq(6,20)
 [1]  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20
> seq(5,121,by=2)
 [1]   5   7   9  11  13  15  17  19  21  23  25  27  29  31  33  35  37  39  41
[20]  43  45  47  49  51  53  55  57  59  61  63  65  67  69  71  73  75  77  79
[39]  81  83  85  87  89  91  93  95  97  99 101 103 105 107 109 111 113 115 117
[58] 119 121
> seq(5,121,length=10)
 [1]   5.00000  17.88889  30.77778  43.66667  56.55556  69.44444  82.33333
 [8]  95.22222 108.11111 121.00000
  • 新建向量

> a=c(2,3,4,2,3,2,1,4,3,2,1)
> which.max(a)
[1] 3
> a[which.max(a)]
[1] 4
> which(a==2)
[1]  1  4  6 10
> a[which(a==2)]
[1] 2 2 2 2
> which(a>5)
integer(0)
> a[which(a>5)]
numeric(0)
> a=1:20
> a
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20
> rev(a)
 [1] 20 19 18 17 16 15 14 13 12 11 10  9  8  7  6  5  4  3  2  1
> a=c(2,3,4,5,6,6,7,8,3,2)
> sort(a)
 [1] 2 2 3 3 4 5 6 6 7 8
> rev(sort(a))
 [1] 8 7 6 6 5 4 3 3 2 2
  • 生成矩阵

> a1=c(1:12)
> matrix(a1,nrow=3,ncol=4)
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> matrix(a1,nrow=4,ncol=3)
     [,1] [,2] [,3]
[1,]    1    5    9
[2,]    2    6   10
[3,]    3    7   11
[4,]    4    8   12
> matrix(a1,nrow=4,ncol=3,byrow=T)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
  • 矩阵运算

矩阵相加

> a=matrix(1:12,nrow=3,ncol=4)
> t(a)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
> a=b=matrix(1:12,nrow=3,ncol=4)
> a+b
     [,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24
> a-b
     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

矩阵相乘

> a=matrix(1:12,nrow=3,ncol=4)
> b=matrix(1:12,nrow=4,ncol=3)
> a%*%b
     [,1] [,2] [,3]
[1,]   70  158  246
[2,]   80  184  288
[3,]   90  210  330
> a=matrix(1:16,nrow=4,ncol=4)
> a
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    2    6   10   14
[3,]    3    7   11   15
[4,]    4    8   12   16
> diag(a)
[1]  1  6 11 16
> diag(diag(a))
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    6    0    0
[3,]    0    0   11    0
[4,]    0    0    0   16
> diag(4)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1

矩阵求逆

> a=matrix(rnorm(16),4,4)
> a
             [,1]        [,2]       [,3]       [,4]
[1,] -1.604650746 -2.22482987  1.5094439  1.0070701
[2,]  0.006409861 -0.01506928 -0.6651050 -1.9342548
[3,] -1.606959408 -0.49430092 -0.9376593  0.1979031
[4,]  0.422441416 -0.33201336  0.3848287  1.1256368
> solve(a)
           [,1]       [,2]       [,3]       [,4]
[1,] -0.1426715  0.5944611 -0.1676185  1.1786143
[2,] -0.1804919 -0.9604913 -0.2055298 -1.4528592
[3,]  0.3168603 -0.5776493 -0.6252734 -1.1661647
[4,] -0.1080209 -0.3089139  0.2160497  0.4162172

解线性方程组

> a=matrix(rnorm(16),4,4)> a             [,1]        [,2]       [,3]       [,4][1,] -1.604650746 -2.22482987  1.5094439  1.0070701[2,]  0.006409861 -0.01506928 -0.6651050 -1.9342548[3,] -1.606959408 -0.49430092 -0.9376593  0.1979031[4,]  0.422441416 -0.33201336  0.3848287  1.1256368> solve(a)           [,1]       [,2]       [,3]       [,4][1,] -0.1426715  0.5944611 -0.1676185  1.1786143[2,] -0.1804919 -0.9604913 -0.2055298 -1.4528592[3,]  0.3168603 -0.5776493 -0.6252734 -1.1661647[4,] -0.1080209 -0.3089139  0.2160497  0.4162172> a=matrix(rnorm(16),4,4)> a           [,1]       [,2]        [,3]        [,4][1,]  1.0451867 -0.2426553 -0.51232551 -0.12062549[2,] -1.5518006 -0.1333096  0.03677731 -0.10715366[3,] -1.0620249 -1.3160312  0.01713207  0.09320016[4,] -0.6664664  2.2398778  1.94861889  0.01788447> b=c(1:4)> b[1] 1 2 3 4> solve(a,b)[1]   0.9840158  -4.6924392   8.0064010 -24.3295023

矩阵的特征值与特征向量

> a=diag(4)+1
> a
     [,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2
> a.e=eigen(a,symmetric=T)
> a.e
$values
[1] 5 1 1 1

$vectors
     [,1]       [,2]       [,3]       [,4]
[1,] -0.5  0.8660254  0.0000000  0.0000000
[2,] -0.5 -0.2886751 -0.5773503 -0.5773503
[3,] -0.5 -0.2886751 -0.2113249  0.7886751
[4,] -0.5 -0.2886751  0.7886751 -0.2113249

> a.e$vectors%*%diag(a.e$values)%*%t(a.e$vectors)
     [,1] [,2] [,3] [,4]
[1,]    2    1    1    1
[2,]    1    2    1    1
[3,]    1    1    2    1
[4,]    1    1    1    2
  • 数据框

> x1=c(10,13,14,23,43)
> x2=c(12,35,35,67,54)
> x=data.frame(x1,x2)
> x
  x1 x2
1 10 12
2 13 35
3 14 35
4 23 67
5 43 54
> plot(x)#散点图

  • 读文本文件

(x=read.table("abc.txt"))
#读剪贴板
y=read.table("clipboard",header=F)
y
z=read.table("clipboard",header=T)
z
  • 循环语句

for语句

> for(i in 1:59) {a[i]=1*2+3}
> a
 [1] 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
[39] 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
>
> b=0
> for(i in 1:59) {a[i]=i*2+3;b[i]=i*5-4}
> b
 [1]   1   6  11  16  21  26  31  36  41  46  51  56  61  66  71  76  81  86  91
[20]  96 101 106 111 116 121 126 131 136 141 146 151 156 161 166 171 176 181 186
[39] 191 196 201 206 211 216 221 226 231 236 241 246 251 256 261 266 271 276 281
[58] 286 291

while语句

a[1]=5
> i=1
> while(a[i]<121) {i=i+1;a[i]=a[i-1]+2}
> a
 [1]   5   7   9  11  13  15  17  19  21  23  25  27  29  31  33  35  37  39  41
[20]  43  45  47  49  51  53  55  57  59  61  63  65  67  69  71  73  75  77  79
[39]  81  83  85  87  89  91  93  95  97  99 101 103 105 107 109 111 113 115 117
[58] 119 121
  • R脚本引用

source()
print()
时间: 2024-11-14 22:07:40

R与数据分析旧笔记(一)基本数学函数的使用的相关文章

R与数据分析旧笔记(十八完结) 因子分析

因子分析 因子分析 降维的一种方法,是主成分分析的推广和发展 是用于分析隐藏在表面现象背后的因子作用的统计模型.试图用最少的个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量 因子分析的主要用途 减少分析变量的个数 通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变量分为一组,用共性因子来代替该变量 使问题背后的业务因素的意义更加清晰呈现 与主成分分析的区别 主成分分析侧重"变异量",通过转换原始变量为新的组合变量使到数据的"变异量"最

R与数据分析旧笔记(十五) 基于有代表性的点的技术:K中心聚类法

基于有代表性的点的技术:K中心聚类法 基于有代表性的点的技术:K中心聚类法 算法步骤 随机选择k个点作为"中心点" 计算剩余的点到这个k中心点的距离,每个点被分配到最近的中心点组成聚簇 随机选择一个非中心点,用它代替某个现有的中心点,计算这个代换的总代价S 如果S<0,则用代替,形成新的k个中心点集合 重复2,直至中心点集合不发生变化 K中心法的实现:PAM PAM使用离差平方和来计算成本S(类似于ward距离的计算) R语言的cluster包实现了PAM K中心法的优点:对于&

R与数据分析旧笔记(三)不知道取什么题目

连线图 > a=c(2,3,4,5,6) > b=c(4,7,8,9,12) > plot(a,b,type="l") 多条曲线效果 plot(rain$Tokyo,type="l",col="red",ylim=c(0,300), main="Monthly Rainfall in major cities", xlab="Month of Year", ylab="Rainf

R与数据分析旧笔记(十二)分类

分类:分类的意义 分类:分类的意义 传统意义下的分类:生物物种 预测:天气预报 决策:yes or no 分类的传统模型 分类(判别分析)与聚类有什么差别 ? 常见分类模型与算法 线性判别法 距离判别法 叶贝斯分类器 决策树 支持向量机(SVM) 神经网络 线性判别法(Fisher) 例子:天气预报数据 > G=rep(c(1,2),c(10,10))> G [1] 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2> x1=c(-1.9,-6.9,5.2,5

R与数据分析旧笔记(十七) 主成分分析

主成分分析 主成分分析 Pearson于1901年提出的,再由Hotelling(1933)加以发展的一种多变量统计方法 通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目 可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析 成分的保留:Kaiser主张(1960)将特征值小于1的成分放弃,只保留特征值大于1的成分 如果能用不超过3-5个成分就能解释变异的80%,就算是成功 通过对原是变量进行线性组合,得到优化的指标 把原先多个指标的计算降维为少量几个经过优化指标的计

R与数据分析旧笔记(十二)分类 (支持向量机)

支持向量机(SVM) 支持向量机(SVM) 问题的提出:最优分离平面(决策边界) 优化目标 决策边界边缘距离最远 数学模型 问题转化为凸优化 拉格朗日乘子法--未知数太多 KKT变换和对偶公式 问题的解决和神经网络化 对偶公式是二次规划问题,有现成的数值方法可以求解 大部分的拉格朗日乘子为0,不为0的对应于"支持向量"(恰好在边界上的样本点) 只要支持向量不变,修改其他样本点的值,不影响结果,当支持变量发生改变时,结果一般就会变化 求解出拉格朗日乘子后,可以推出w和b,判别函数可以写成

R与数据分析旧笔记(四)画地图练习

> library(maps) > library(geosphere) 载入需要的程辑包:sp > map("state")#画美国地图 > map("world")#画世界地图 > xlim<-c(-171.738281,-56.601563) > ylim<-c(12.039321,71.856229) > map("world",col="#f2f2f2",fill

R与数据分析旧笔记(十四) 动态聚类:K-means

动态聚类:K-means方法 动态聚类:K-means方法 算法 选择K个点作为初始质心 将每个点指派到最近的质心,形成K个簇(聚类) 重新计算每个簇的质心 重复2-3直至质心不发生变化 kmeans()函数 > X=iris[,1:4]> km=kmeans(X,3)> kmK-means clustering with 3 clusters of sizes 62, 50, 38 Cluster means: Sepal.Length Sepal.Width Petal.Length

MySQL函数学习笔记一:数学函数

1. ABS(x): 返回x的绝对值 mysql> select ABS(1), ABS(-1), ABS(0); +--------+---------+--------+ | ABS(1) | ABS(-1) | ABS(0) | +--------+---------+--------+ |      1 |       1 |      0 | +--------+---------+--------+ 2. PI(): 返回圆周率 mysql> select PI(); +-----