第二章:创建数据集
2.1数据集的概念
数据库中的记录与字段
2.2数据结构
2.2.1 向量:拥有相同数据类型的一维数组(可以使用类似python的切片功能)
a<-(1,2,3,4);
2.2.2矩阵:拥有相同数据类型的二维数组,利用matrix创建
y<-matrix(1:20,nrow=5,ncol=4) #创建一个矩阵
2.2.3数组,利用array创建
2.2.4数据框
mydata<-data.frame(clo1,col2,col3);创建一个数据框
2.2.5因子:类别数量和有序数量在R中称谓因子
status<-c("Type1“,"Type2“,"Type1“,"Type1“) 语句status<-factor(status,ordered=TRUE)会将此向量存储为(1,2,1,1)
2.2.6列表:是一些对象的有序集合
mylist<-list(obj1,obj2)
2.3数据分输入
2.3.1 键盘输入:输入下列语句时会自动跳出输入框,可以适应键盘输入
mydata <-data.frame(age=numeric(0), gender=character(0), height=numeric(0)) mydata<-edit(mydata)
2.3.2 带分隔符的文本文件导入:header 是一个表明首行是否包含了变量名的逻辑值( TRUE 或 FALSE ), sep 用来指定分隔数据的分隔符, row.names 是一个可选参数,用以指
定一个或多个表示行标识符的变量。
mydata <-read.table(file,header = logical_value, sep="delimiter",row.names = "name")
2.3.3 访问数据库:安装RODBC包,然后链接数据库取值
install.packages(RODBC) library(RODBC) myconn<-odbcConnect("mydsn",uid="tom",pwd = "xxxxx") crimdat<-sqlFetch(myconn,Crime) pundat<-sqlQuery(myconn,"select * from Punishment") close(myconn)
2.4处理数据对象的实用函数
时间: 2024-10-26 22:22:21