R的数据结构

R的数据结构

R语言

两种常用的数据结构示例(R version 3.2.2):

Vertor 向量

c函数语法:c(data1, data2,data3, ...)

> c(1,2,3,4,5,6)
[1] 1 2 3 4 5 6       # 开始的[1]代表随后输出的1在向量中的位置是第1位
> c(TRUE,FALSE)       # 逻辑型变量注意是大写TRUE和FALSE
[1]  TRUE FALSE
> c("a","b","c")      # 字符型变量使用单引号或双引号括起来都可,但输出时都是双引号
[1] "a" "b" "c"
> c(1,2,TRUE)            # 逻辑型变量TRUE被转换成数值1
[1] 1 2 1
> c(1,2,FALSE)           # 逻辑型变量FALSE被转换成数值0
[1] 1 2 0
> C("A","B",TRUE)        # 逻辑型变量和字符型变量不能混用
Error in C("A", "B", TRUE) : 不能把对象解释成因子
> c(1,2,"A")
[1] "1" "2" "A"          # 数值型变量1,2被转换成字符型“1”,“2”

向量的访问:Val[index]

> x <- c(2,5,7,9,10)
> x[2]                   # 向量的位置从1开始
[1] 5
> x[2:5]                 # 使用冒号可访问从2到5位置上的数据
[1]  5  7  9 10
> x[6]                   # 如果位置置超过向量总长度,则只能返回NA
[1] NA                   # NA 即 NotAvailable,表示这个位置上没有数据,不可用

Frame 数据框

data.frame函数语法:data.frame(向量1, 向量2, 向量3, ..., 向量n)

> name <- c("Amy", "Jean", "July")
> age <- c(20, 21, 22)
> f <- data.frame(name, age)   # 向量作为数据框中的列
> f
  name age              # 向量的变量名作为数据框的列名
1  Amy  20
2 Jean  21
3 July  22

数据框的访问:数据框的变量名[行位置, 列位置]

> f
  name age
1  Amy  20
2 Jean  21
3 July  22
> f[1,2]            # 同时输入行位置和列位置,返回对应行列位置上的值
[1] 20
> f[1,]             # 只是输入行位置,返回对应行位置上的所有值
  name age
1  Amy  20
> f[,1]             # 只是输入列位置,返回对应列位置上的所有值
[1] Amy  Jean July
Levels: Amy Jean July

可视化编辑工具:fix(dataFrame)
通过fix(f),调用出数据编辑器,将Amy修改为Dany,如下,

可见数据框中的Amy确实被修改成了Dany,

当然,利用f <- data.frame()生成一个空的数据框,再通过fix(f)在数据编辑器中直接编辑行列变量也是可以的。

时间: 2024-10-07 17:44:02

R的数据结构的相关文章

R语言-数据结构

1.向量 向量是用来存储数值型.字符型或逻辑性数据的一维数组,用函数c()创建向量 a <- c(1,2,5,6,4) b <- c("one","two","three") c <- c("TRUE","FALSE") 2.矩阵 矩阵是一个二维数组,只是每个元素都拥有相同的模式,用函数matrix()创建矩阵 y <- matrix(1:20, nrow = 5, ncol = 4

R中数据结构

进行任何数据分析的第一步:创建包含研究信息的数据集. 在R中这个步骤包括以下两步: 1. 选择一种数据结构来存储数据: 2. 将数据输入或导入到这个数据结构中. 一. 数据集 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量. 下图是一个假想的病例数据集: R中的数据结构包括:标量.向量.矩阵.数组.数据框和列表. 上图实际为R中的一个数据框. R可以处理的数据类型包括:数值类型.字符型.逻辑性(TRUE/FALSE).复数型(虚数)和原生型(字节). 上图中 前三列为数值型变量.后

R语言数据结构详解

R有多种存储数据的对象类型.基本的类型可分为: 1.向量 向量中的数据必须拥有相同类型或模式(数值型.字符型.逻辑型):向量类似c语言中的数组:实例:>a<-c(1,2,3,4,5,6)>b<-c(“one”,”two”,”three”)>c<-c(TURE,FALSE,TRUE)标量是指只含一个元素的向量:实例:>e<-3 访问向量中的元素(向量中的元素从1开始,这点与数组不同):>a<-c(1,2,5,7,-5,4) >a[3][1]

R 语言数据结构 --1 向量和因子②因子-vector

2018年6月8日 今天是学习R的第二天 感觉进度有些缓慢,需要加速一下了.另外昨天貌似写的不是特别好,所以今天打算对整体编辑研究一下. 今天来学习一下 因子,首先:什么是因子?因为我们知道了R中的向量,另外因为学习过一段时间的python 所以对字典,数组什么的有理解力.那么,对于因子 我可以看成一个有一点字典味道的向量.(个人理解) 百度的定义是这样的: 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数.因子表示分类变量

R 语言数据结构 --2 矩阵和数据框①矩阵-matrix

矩阵-matrix-2018年6月9日 今天很可惜,没有过多地学习R语言(主要因为去听了党课,学习了党重要讲话,所以没有看书),所以今天就总结一个矩阵吧.不过多的学习了. 首先稍微复习一下昨天的因子,首先要记得的就是mode()看每个元素,class()看整体是什么,另外如果你把TRUE abc 1都传给一个向量,那向量会把它进行类型转换.安全性:字符串>数字>逻辑值.会尽量向安全性高的转换.这个是隐式类型转换.当然也可以用as家族进行类型转化,例如将数字转换成字符串:as.character

R语言数据结构二

上节我们讲到R语言中的基本数据类型,包括数值型,复数型,字符型,逻辑型以及对应的操作和不同数值类型之间的转换.众所周知,R语言的优势在于进行数据挖掘,大数据处理等方面,因此单个的数据并不能满足我们的需要,于是向量,矩阵,数组,数据框等变量类型应运而生. 向量:与我们在数学里面所学到的向量不同,R语言中的向量类似于我们在C语言中学习的数组,表示一个同种数据类型的数据集. 向量的创建:在R语言中使用c( )命令就创建了一个向量,任何类型的数据都可以组成向量,但一个向量里面的数据最好类型一致,不然会发

R语言数据结构

R 语言数据结构 --2 矩阵和数据框②数据框-dataframe

2018年6月11日晚,今天又中午没睡觉,但是还是不觉得困.也不觉得头疼,其实很多事情都是分人的.你不一定非要午睡,午睡是给早上干完活回寝室特别累的人,是视情况而定的,并不是每个人每天都要午睡的,很多事情养成了习惯反而是一种拖累,相反适时而动才是明智之举.比如早起早睡是好习惯,午睡如果下午会觉得头疼,就应该反思适不适合自己,很多事情也是这样.强迫自己并不好. 说多了,说回来,今天讲数据框dataframe 注意是data不是date.很重要!!!打错字哭都没用. 1dataframe的创建: 一

从零开始系列-R语言基础学习笔记之二 数据结构(一)

在上一篇中我们一起学习了R语言的环境搭建,这次我们开始学习R语言的数据结构第一部分:向量.数组和矩阵. 一.向量 向量是一维数组,其内容可以是数值.字符或布尔值,但所有数据的类型必须一致.创建向量使用的关键字是c,访问向量中的元素使用[],具体如下: 创建数值向量a<-c(1,2,3,4,5,6) 创建字符向量b<-c("a","b","c") 创建布尔向量c<-c(TRUE,FALSE) 访问向量: a[3] 得到的值是3,注