R语言实战-数据类型-2(数据框dataframe)

5、数据框dataframe  data.frame

创建

data.frame()

 1 > a<-c(1,2,3,4,5)
 2 > b<-c(‘a‘,‘b‘,‘c‘,‘d‘,‘e‘)
 3 > c<-c(T,F,F,F,T)
 4 > x<-data.frame(a,b,c)
 5 > x
 6   a b     c
 7 1 1 a  TRUE
 8 2 2 b FALSE
 9 3 3 c FALSE
10 4 4 d FALSE
11 5 5 e  TRUE

PS:子元素个数不同时会报错

1 > a<-c(1,2,3,4,5,6,7)
2 > b<-c(‘a‘,‘b‘,‘c‘,‘d‘,‘e‘)
3 > c<-c(T,F,F,F,T)
4 > x<-data.frame(a,b,c)
5 Error in data.frame(a, b, c) : 参数值意味着不同的行数: 7, 5

PS:dataframe与其他语言中的dataset数据集类似

数据引用

 1 > x[c(‘a‘,‘c‘)]
 2   a     c
 3 1 1  TRUE
 4 2 2 FALSE
 5 3 3 FALSE
 6 4 4 FALSE
 7 5 5  TRUE
 8 > x[2:3]
 9   b     c
10 1 a  TRUE
11 2 b FALSE
12 3 c FALSE
13 4 d FALSE
14 5 e  TRUE
15 > x[2:3,2]
16 [1] b c
17 Levels: a b c d e
18 > x[2:3,1]
19 [1] 2 3
20 > x[2:3,3]
21 [1] FALSE FALSE

PS:$引用法

1 > x$a
2 [1] 1 2 3 4 5

attach()与detach()

 1 > attach(x)
 2 The following objects are masked _by_ .GlobalEnv:
 3
 4     a, b, c
 5
 6 > a
 7 [1] 1 2 3 4 5 6 7
 8 > b
 9 [1] "a" "b" "c" "d" "e"
10 > c
11 [1]  TRUE FALSE FALSE FALSE  TRUE
12 > a[5]
13 [1] 5
14 > b[3]
15 [1] "c"
16 > detach(x)
17 > a
18 [1] 1 2 3 4 5 6 7
19 > b
20 [1] "a" "b" "c" "d" "e"
21 > c
22 [1]  TRUE FALSE FALSE FALSE  TRUE
23 > remove(a,b)
24 > remove(c)
25 > a
26 Error: object ‘a‘ not found
27 > b
28 Error: object ‘b‘ not found
29 > attach(x)
30 > a
31 [1] 1 2 3 4 5
32 > b
33 [1] a b c d e
34 Levels: a b c d e
35 > detach(x)

with()

1 > with(x,{
2 +   m<-a[1]+a[5]
3 +   m
4 +   n<-paste(b[1],b[2],b[5],sep = ‘+‘)
5 +   n
6 + })
7 [1] "a+b+e"

Usage

data.frame(..., row.names = NULL, check.rows = FALSE,
           check.names = TRUE, fix.empty.names = TRUE,
           stringsAsFactors = default.stringsAsFactors())

原文地址:https://www.cnblogs.com/qianheng/p/10801592.html

时间: 2024-08-29 16:56:16

R语言实战-数据类型-2(数据框dataframe)的相关文章

R语言实战-数据类型-1(标量、向量、矩阵、数组)

0.基本数据类型 数值型num,包含整形.浮点型.双精度型等所有数值类型 字符型factor,字符和字符串,因子 布尔值logi,布尔型,T,TRUE,F,FALSE 1.标量 单个的数值.字符值或者布尔值 2.向量 函数c() 1 a<-c(1,2,3,4) 2 b<-c('aa','bb','cc') 3 c<-c(TRUE,FALSE,TRUE) 访问向量的元素 []中括号中指定元素的下标 可以是单个数值,也可以是数值向量,还可以用x:y的形式指定一个范围 1 > d<

《r语言实战》菜鸟学习笔记(二)

这一部分将要说明R语言的数据类型以及数据输入方面的内容 因子 R语言中变量可以归结为名义型,有序型和连续变量. 名义型 :没有顺序之分的变量.如 天气 阴晴等 有序型:有顺序关系,但不是数量关系. 心情好 坏 适中等 连续型:就是同是有数量和顺序.当然这里的连续型并不是数学中的连续,也包括离散数据 名义型和有序型在R中称为因子. 下面介绍factor()函数 diabetes <- c("Type1", "Type2", "Type1",

R 语言数据结构 --2 矩阵和数据框②数据框-dataframe

2018年6月11日晚,今天又中午没睡觉,但是还是不觉得困.也不觉得头疼,其实很多事情都是分人的.你不一定非要午睡,午睡是给早上干完活回寝室特别累的人,是视情况而定的,并不是每个人每天都要午睡的,很多事情养成了习惯反而是一种拖累,相反适时而动才是明智之举.比如早起早睡是好习惯,午睡如果下午会觉得头疼,就应该反思适不适合自己,很多事情也是这样.强迫自己并不好. 说多了,说回来,今天讲数据框dataframe 注意是data不是date.很重要!!!打错字哭都没用. 1dataframe的创建: 一

R电子书资料《学习R》+《R语言实战第2版》+《R数据科学》学习推荐

如果没有任何编程基础,想学习如何使用R,并进行练习,建议大家看看<学习R>电子书和代码资料,上半部分主要介绍R的技术细节和使用技巧,下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程. <学习R>电子书,帮助学习编写简单的R程序,知道R语言能做什么: 1.使用向量.数组.列表.数据框和字符串等数据类型 2.掌握条件语句以及分支和循环控制语句 3.应用R的扩展包,将你自己的工作成果打包发给其他人 4.清理从各种来源导入的数据 5.通过可视化和汇总统计理解数据 6.使

大数据分析学习之使用R语言实战机器学习视频课程

大数据分析学习之使用R语言实战机器学习网盘地址:https://pan.baidu.com/s/1Yi9H6s8Eypg_jJJlQmdFSg 密码:0jz3备用地址(腾讯微云):https://share.weiyun.com/5tk6j1Z 密码:rdia9t 机器学习的核心主要侧重于找出复杂数据的意义.这是一个应用广泛的任务,机器学习的使用是非常广泛的. 本课程主要分为两个阶段,第一个部分:掌握R语言的处理数据的基本语法.第二部分:介绍机器学习原理,并通过大量的案例,为学员介绍R语言通过机

R入门&lt;三&gt;-R语言实战第4章基本数据管理摘要

入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好,相应的导入导出均较为方便(read.table, write等) reshape:目前用到rename函数,可以方便的对数据变量重命名 fCalendar:在日期输入处提及,据说对日期运算有奇效,但无具体示例.同理如lubridate sqldf:在数据选取处提及,可代替subset以及各种whe

《R语言实战》学习笔记seventh

由于在准备软考中级数据库系统工程师外加巩固SQL Server 2012,所以拖了好久一直没继续学R 下去 所以今天重开R 的战事 这次是关于基本统计分析的内容,即关于用于生成基本的描述性统计量和推断统计量的R 函数 首先,将着眼于定量变量的位置和尺度的衡量方式 然后将是生成类别型变量的频数表和列联表的方法(以及连带的卡方检验) 接下来将考察连续型和有序型变量相关系数的多种形式 最后转而通过参数检验(t检验)和非参数检验(Mann-Whitney U检验.Kruskal-Wallis检验)方法研

《R语言实战》学习笔记fourth

又拖了好久继续写R 语言的学习笔记了啊 这次到了基本数据管理了,众所周知数据准备是数据分析的最重要的前提 书本是从一个例子开始本章的内容的,例子是一个类似调查问卷的 然后把回答标为从1到5,再进行分析(这让我想到了自学SPSS 的时候啊) > manager <- c(1, 2, 3, 4, 5) > date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08&q

R语言实战(五)方差分析与功效分析

本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ==================================================================== 方差分析: 回归分析是通过量化的预测变量来预测量化的响应变量,而解释变量里含有名义型或有序型因子变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法就是方差分析(ANOVA).因变量不只一个时,称为多元方差分析(MANOVA).有协变量时,称为协方差分析(ANCOVA)或多元协方差分析