R统计建模与R软件

教材目录


第一章 概率统计的基本知识

第二章 R软件的使用

第三章 数据描述性分析

第四章 参数估计

第五章 假设检验

第六章 回归分析

第七章 方差分析

第八章 应用多元分析(I)

第九章 应用多元分析(II)

第十章 计算机模拟


第一章 概率统计的基本知识

 

第二章 R软件的使用


2.1 求均值和方差

> X1 <- c(35,40,40,42,37,45,43,37,44,42,41,39)
> mean(X1)
[1] 40.41667
> sd(X1)
[1] 3.028901
> X2 <- c(60,74,64,71,72,68,78,66,70,65,73,75)
> mean(X2)
[1] 69.66667
> sd(X2)
[1] 5.210712

2.2 绘制双变量散点图和单变量直方图

> X1 <- c(35,40,40,42,37,45,43,37,44,42,41,39)
> X2 <- c(60,74,64,71,72,68,78,66,70,65,73,75)
> plot(X1, X2)
> hist(X1)
> hist(X2)

2.3 对身高和体重作线性回归分析

> rt <- read.table("exam0203.txt", head=TRUE);rt
      Name Sex Age Height Weight
1    Alice   F  13   56.5   84.0
2    Becka   F  13   65.3   98.0
3     Gail   F  14   64.3   90.0
4    Karen   F  12   56.3   77.0
5    Kathy   F  12   59.8   84.5
6     Mary   F  15   66.5  112.0
7    Sandy   F  11   51.3   50.5
8   Sharon   F  15   62.5  112.5
9    Tammy   F  14   62.8  102.5
10  Alfred   M  14   69.0  112.5
11    Duke   M  14   63.5  102.5
12   Guido   M  15   67.0  133.0
13   James   M  12   57.3   83.0
14 Jeffrey   M  13   62.5   84.0
15    John   M  12   59.0   99.5
16  Philip   M  16   72.0  150.0
17  Robert   M  12   64.8  128.0
18  Thomas   M  11   57.5   85.0
19 William   M  15   66.5  112.0
> lm.sol <- lm(Weight~Height, data=rt)
> summary(lm.sol)

Call:
lm(formula = Weight ~ Height, data = rt)

Residuals:
     Min       1Q   Median       3Q      Max
-17.6807  -6.0642   0.5115   9.2846  18.3698 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept) -143.0269    32.2746  -4.432 0.000366 ***
Height         3.8990     0.5161   7.555 7.89e-07 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.23 on 17 degrees of freedom
Multiple R-squared:  0.7705,    Adjusted R-squared:  0.757
F-statistic: 57.08 on 1 and 17 DF,  p-value: 7.887e-07
source("MyFile.R")
load("MyWorkSpace.RData")
save.image("MyWorkSpace.RData")

 

 

 

第三章 数据描述性分析

 

第四章 参数估计

 

第五章 假设检验

 

第六章 回归分析

 

第七章 方差分析

 

第八章 应用多元分析(I)

 

第九章 应用多元分析(II)

 

第十章 计算机模拟

时间: 2025-01-03 16:09:55

R统计建模与R软件的相关文章

统计建模与R软件习题二答案

# 习题2 # 2.1 x=c(1,2,3) y=c(4,5,6) e=c(rep(1,3)) z=2*x+y+e;z x%*%y # 若x,y如答案那样定义为矩阵,则不能用%*%,因为,维数不对应, x%o%y # 答案 x<-matrix(1:3,nrow=3) y<-matrix(4:6,nrow=3) e<-matrix(c(1,1,1),nrow=3) z<-2*x+y+e;z crossprod(x,y)#内积 outer(x,y)#外积 # 2.2 A=matrix(

统计建模与R软件第二章习题答案

# 2.1 x <- c(1,2,3);y <- c(4,5,6) e <- c(1,1,1) #1) z <- 2*x+y+e;z #2) crossprod(x,y) #3) outer(x,y) #2.2 #按列输入(默认) A <- matrix(1:20,c(4,5)) #按行输入 B <- matrix(1:20,c(4,5),byrow = TRUE) #1) C <- A+B;C #2) D <- A*B;D #3) #4) A[1:3,1:

【R统计】聚类分析

题目: 为了深入地了解我国人口的文化程度,利用1990年全国普查数据对全国30个省.直辖市.自治区进行聚类分析,分别选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ):(2)初中文化程度的人口占全部人口的比例(CZBZ):(3)文盲半文盲人口占全部人口的比例(WMBZ)分别用来反映较高.中等.较低文化程度人口的状况.(1)计算样本的欧几里得距离,分别用最长距离法.均值法.重心法和ward法作聚类分析,并画出相应的谱系图,如果将所有样本分为4类,试写出个种方案的分类结果:(2

【R统计】基于相似系数的聚类分析

题目: 对48名应聘者数据的自变量作聚类分析,选择变量的相关系数作为变量间的相似系数(cij),距离定义为dij=1-cij.分别用最长距离法.均值法.重心法和Ward法作聚类分析,并画出相应的谱系图.如果将所有变量分为5类,试写出各种方法的分类结果. 数据(applicant.data): FL APP AA LA SC LC HON SMS EXP DRV AMB GSP POT KJ SUIT 1 6 7 2 5 8 7 8 8 3 8 9 7 5 7 10 2 9 10 5 8 10 9

代写statistical R 程序、代做留学生R统计作业

代写statistical R 程序.代做留学生R统计作业1. This is a take-home final exam.2. Answers to Questions 1,2,3,4 should be written using a Latex editor. Question 5 can beanswered using your preferred program. All answers should be merged in a single PDF andsubmitted i

UPC 2224 Boring Counting (离线线段树,统计区间[l,r]之间大小在[A,B]中的数的个数)

题目链接:http://acm.upc.edu.cn/problem.php?id=2224 题意:给出n个数pi,和m个查询,每个查询给出l,r,a,b,让你求在区间l~r之间的pi的个数(A<=pi<=B,l<=i<=r). 参考链接:http://www.cnblogs.com/zj62/p/3558967.html #include <iostream> #include <cstdio> #include <cstring> #incl

R型思维模式对软件开发的影响(草稿)

The pragmatic programmers 一直在工作之余读些书,之前主要是纯英文版的计算机相关的算法,编译器,数学等,想通过读这些书来提高自己每日工作效能,结果收效甚微.一是,因为纯英文的书,阅读的慢,第二,也是最重要的一点,发现掌握的很慢,思前想后感觉可能是和工作的内容距离较远,两者不能互相辅助,第三,不能直接的回馈工作本身. 索性就换一换类型,最先入手的,是<agile software development-principles, patterns, and practices

R 统计与作图---入门(一)数据类型

R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发.R是基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行.R的语法是来自Scheme. R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux).

【R笔记】给R加个编译器——notepad++

R的日记-给R加个编译器 转载▼ R是一款强大免费且开源的统计分析软件,这是R的长处,可也是其“缺陷”的根源:不似商业软件那样user-friendly.记得初学R时,给我留下最深印象的不是其功能的强大(体会到的其实是),而是其简洁如一张白纸的操作界面,再加上复杂而劳累的一遍遍敲击键盘,感觉用其做一点点统计分析都是噩梦.时至今日,R的编译界面,我依然觉得是用过的软件中最烂的那类.一个这么好的软件为什么就不做一个好用的界面呢? 幸运的是,到目前已经有好几个第三方的编译器可以和R联接.用这些编译器有