R语言学习之主成分分析法的R实践

主成分分析R软件实现程序(一):

>d=read.table("clipboard",header=T) #从剪贴板读取数据

>sd=scale(d)  #对数据进行标准化处理

>sd  #输出标准化后的数据和属性信息,把标准化的数据拷贝到剪贴板备用

>d=read.table("clipboard",header=T)  #从剪贴板读取标准化数据

>pca=princomp(d,cor=T)  #主成分分析函数

>screeplot(pca,type="line",mian="碎石图",lwd=2)  #画出碎石图

从碎石图上可以看出,前两个主成分的方差贡献率比重比较大,下面计算前两个主成分的累积方差贡献率是否超过80%……

>dcor=cor(d) #求相关矩阵

>deig=eigen(dcor)  #求相关矩阵的特征值和特征向量

>deig$values #输出特征值

>sumeigv=sum(deig$values)

>sumeigv   得到k值

>sum(deig$values[1:2])/k #求前两个主成分的累积方差贡献率

>pca$loadings[,1:2]  #输出前2个主成分的载荷系数

观察载荷系数可以得到:主成分C1在……

>deig$values[1]/k;deig$values[2]/k; #计算主成分C1、C2的系数b1、b2

C=(b1*C1+b2*C2)/(b1+b2)=q1*C1+q2*C2

>s=pca$scores[,1:2] #输出前两个主成分的得分

>c=s[1:评价对象的个数,1]*q1+s[1:评价对象的个数,2]*q2

>cbind(s,c)

然后把综合得分c的值从小到大排序,得到最后评价结果。

注意:在这里c的值指的是c的实数的值,并非绝对值。

主成分分析R软件实现程序(二):

在excel中点击复制要读取的文件

>data<-read.table("clipboard",header=T,sep=‘\t‘)

>data

>data.pr<-princomp(data,cor=TRUE) #data为数据矩阵或数据框,cor为是否用相关阵,默认为协差阵,scores为是否输出成分得分

>summary(data.pr,loading=TRUE) #loading=TURE选项列出了主成分对应原始变量的系数

其中:standard deviation 标准偏差 Porportion of Variance 贡献率(方差比例)

comulative proportion 累计贡献率(累计比例)

画出三种碎石图:

>screeplot(data.pr)  #条型

>biplot(data.pr)    #分散型

>screeplot(data.pr,type=("line"))  #线型

时间: 2024-08-01 21:17:11

R语言学习之主成分分析法的R实践的相关文章

R语言学习(5)-字符串和因子

字符串和因子 1.字符串 创建字符串 > c("HELLO","WORLD") [1] "HELLO" "WORLD" 使用paste函数连接字符串 > paste(c("hello","hi"),"world") [1] "hello world" "hi world" > paste(c("hel

R语言学习笔记2——绘图

R语言提供了非常强大的图形绘制功能.下面来看一个例子: > dose <- c(20, 30, 40, 45, 60)> drugA <- c(16, 20, 27, 40, 60)> drugB <- c(15, 18, 25, 31, 40) > plot(dose, drugA, type="b") > plot(dose, drugB, type="b") 该例中,我们引入了R语言中第一个绘图函数plot.pl

R语言学习笔记

參考:W.N. Venables, D.M. Smith and the R DCT: Introduction to R -- Notes on R: A Programming Environment for Data Analysis and Graphics,2003. http://bayes.math.montana.edu/Rweb/Rnotes/R.html 前言:关于R 在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data

R语言学习中的小bug:R中矩阵相乘错误于A %*% B: 需要数值/复数矩阵/矢量参数

遇到了小bug: R中矩阵相乘错误于A %*% B: 需要数值/复数矩阵/矢量参数 看到网上别人的做法,发现了用class(A)和class(B)之后才发现,是因为读入的时候数据的类型不对,A.B的类型并不是matrix,才导致了这个问题. 用as.matrix来变型一下,就OK了. R语言学习中的小bug:R中矩阵相乘错误于A %*% B: 需要数值/复数矩阵/矢量参数,布布扣,bubuko.com

R语言学习(2)

向量矩阵和数组 1.vector函数可以创建指定类型.长度的矢量 (其结果中的值可以是0,FLASE,空字符串) > vector("numeric",5) [1] 0 0 0 0 0 > vector("complex",6) [1] 0+0i 0+0i 0+0i 0+0i 0+0i 0+0i > vector("logical",6) [1] FALSE FALSE FALSE FALSE FALSE FALSE > 

R语言学习(3)

列表和数据框 1.列表 list函数创建列表 > (a_list <- list(c(1,1,2,5,14,42),month.abb,matrix(c(3,-8,1,-3),nrow=2),asin)) [[1]] [1]  1  1  2  5 14 42 [[2]] [1] "Jan" "Feb" "Mar" "Apr" "May" "Jun" "Jul&qu

R语言学习(4)-环境和函数

环境和函数 1.环境 使用new.env函数创建环境 > an_environment <- new.env() 向环境中分配变量与列表相同 > an_environment[["pythag"]] <- c(12,15,20,21) > an_environment$root <- polyroot(c(6,-5,1)) > assign("moonday",weekdays(as.Date("1969/07/2

R语言学习(1)

将R作为科学计算器使用 1.例: > 1:5 + 6:10 [1]  7  9 11 13 15 > c(1,3,5,7,9)+c(2,4,6,8,10) [1]  3  7 11 15 19 > median(2:5) [1] 3.5 > 1:10 / 3 [1] 0.3333333 0.6666667 1.0000000 1.3333333 1.6666667 2.0000000 2.3333333 [8] 2.6666667 3.0000000 3.3333333 > 

R语言学习笔记 之 可视化地研究参议员相似性

基于相似性聚类 很多时候,我们想了解一群人中的一个成员与其他成员之间有多么相似.例如,假设我们是一家品牌营销公司,刚刚完成了一份挂怒有潜力新品牌的研究调查问卷.在这份调查问卷中,我们向一群人展示了新品牌的几个特征,并且要求他们对这个新品牌的每个特征按五分制打分.同时也收集了目标人群的社会经济特征,例如:年龄.性别.种族.住址的邮编以及大概的年收入. 通过这份调查问卷,我们想搞清楚品牌如何吸引不同社会经济特征的人群.最重要的是,我们想要知道这个品牌是否有很大的吸引力.换个角度想这个问题,我们想看看