第4章--基本数据管理

4.1 创建新变量

在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:

变量名←表达式

以上语句中的表达式部分可以分成包含多种运算符合函数。

4.2 变量的重编码

重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:

  • 将一个连续型变量修改为一组类别值;
  • 将误编码的值替换为正确值;
  • 基于一组分数线创建一个表示及格/不及格的变量

函数within(),它允许你修改数据框。

4.3 变量的重命名

可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。

或者,

reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。

4.4 缺失值

在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。

函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。

4.5 日期值

日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。

有两个函数对于处理时间戳数据特别实用。

Sys.Date()可以返回当天的日期;

data()返回当前的日期和时间。

时间: 2024-10-27 04:53:58

第4章--基本数据管理的相关文章

R入门<三>-R语言实战第4章基本数据管理摘要

入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好,相应的导入导出均较为方便(read.table, write等) reshape:目前用到rename函数,可以方便的对数据变量重命名 fCalendar:在日期输入处提及,据说对日期运算有奇效,但无具体示例.同理如lubridate sqldf:在数据选取处提及,可代替subset以及各种whe

第四章 基本数据管理

4 基本数据管理 4.1一个示例(创建leadership数据框) manager<-c(1,2,3,4,5) data<-c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09") country<-c("US","US","UK","UK","UK

《R语言实战》读书笔记--第四章 基本数据管理

本章内容: 操纵日期和缺失值 熟悉数据类型的转换 变量的创建和重编码 数据集的排序,合并与取子集 选入和丢弃变量 多说一句,数据预处理的时间是最长的--确实是这样的,额. 4.1一个示例 4.2创建新变量 算术运算符:+.-.*./.^(**)(求幂).x %% y(取余运算).x %/% y(整数除法). transform函数: transform函数现在只用于数据框.对数据框进行操作. 例子: mydata <- transform(mydata, sumx = x1+x2, meanx

《Docker技术入门与实战》pdf

下载地址:网盘下载 内容简介  · · · · · · [编辑推荐] <Docker技术入门与实战>是中国首部docker著作,一线Docker先驱实战经验结晶,来自IBM和新浪等多位技术专家联袂推荐! <Docker技术入门与实战>结合企业生产环境,深入浅出地剖析 Docker 的核心概念.应用技巧.实现原理以及生态环境,为解决各类问题提供了有价值的参考. [内容简介] 在云计算时代,开发者将应用转移到云上已经解决了硬件管理的问题,然而软件配置和管理相关的问题依然存在.Docke

R语言笔记 数学函数

数学函数 表5-2列出了常用的数学函数和简短的用例. 表5-2 数学函数 函 数 描 述 abs(x) 绝对值 abs(-4)返回值为4 sqrt(x) 平方根sqrt(25)返回值为5 和25^(0.5)等价 ceiling(x) 不小于x的最小整数 ceiling(3.475)返回值为4 floor(x) 不大于x的最大整数 floor(3.475)返回值为3 trunc(x) 向 0 的方向截取的x中的整数部分 trunc(5.99)返回值为5 图灵社区会员 matrixvirus([em

关于2016年计划

2016年过去了八个月,去掉元月份和2月份的一些日子,只有6个多月,其中我用三个月的时间开发javafx(现在还是烂尾楼工程),有一个月的时间在外培训,有一个月的时间休假在家带崽,还有一个月的时间瞎忙,不知道干什么了,不过把周末算进来也差不多,人也不是机器,我的本意也是在不要太功利,通过自己的积累做一些有益的工作. javafx闲暇时间还是要完成相关的工程. 近一段时间想研究一下R语言,做一些数据的可视化与分析挖掘工作.这或许就是今年的全部计划了,精力有限,需要脚踏实地去实施. 关于R语言的学习

《Python自然语言处理》

<Python自然语言处理> 基本信息 作者: (美)Steven Bird    Ewan Klein    Edward Loper 出版社:人民邮电出版社 ISBN:9787115333681 上架时间:2014-6-13 出版日期:2014 年6月 开本:16开 页码:508 版次:1-1 所属分类:计算机 > 软件与程序设计 > Python 更多关于>>><Python自然语言处理> 内容简介 书籍 计算机书籍 自然语言处理(natural

《R语言实战》学习笔记fifth

总算到了第5章-高级数据管理了啊 作为这本书第一部分-入门的收官之章,本章还是挺重要的呢 这章可以分为三个部分,第一部分:快速浏览R 中的多种数学.统计和字符处理函数,第二部分:如何编写函数来完成数据处理和分析任务,第三部分:了解数据的整合和概数方法,以及数据集的重塑和重构方法 > 学生姓名 <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jo

《php与mysql权威指南》第三部分02

第14章 mysql数据库开发14.1 mysql数据类型 1.数值类型: 五种整型:tinyint,smallint,mediumint,int,bigint分别为1,2,3,4,8字节数 三种浮点型:float,double,decimal分别4,8,m字节 # 声明一个整数类型时,要给它指定一个显示宽度,只是以多少宽度显示,并不是数值的款单,所占空间是固定的,例如bigint(4),显示设置为4,所占还是8个字节,最大取值不变 2.字符串类型 char(M);//m个字节,其中0<=m<