《R语言实战》读书笔记--为什么要学

本人最近在某咨询公司实习，涉及到了一些数据分析的工作，用的是R语言来处理数据。但是在应用的过程中，发现用R很不熟练，所以再打算学一遍R。曾经花一个月的时间看过一遍《R语言编程艺术》，还用R做过阿里的推荐算法比赛，对R语言有一些最初级、基本的了解。不过，上面那本书虽然挺好，但是不适合速成，是从程序员的角度写的，对常用函数和统计知识涉及的不多。在实际工作中，发现适时应用R的包和函数是十分重要的，所以打算另找一本书来看。在学校放着一本《R语言实战》，无奈没拿过来，就用电子版的学一遍吧。

自己想来应该按照下面的原则去学：

1、迅速。因为对R已经有了基本的了解，对统计也有了一些了解，所以学得时候重点在学习具体函数和数据处理过程上，其他对R本身的学习适度减少。

2、重视书中的案例。实际工作中的经历告诉我，数据一般是不理想的，那么如何更好地适应这种情况呢？多学学实际案例吧。

3、尽量学一些高级的R语言知识，比如R与数据库啊，用R做机器学习，用R编辑文档等，当然这只是一个愿望而已。

4、写博客少些废话，多写精炼的话。写博客是比较耗费时间的，但是价值很高，所以在写R语言学习笔记的时候，要以高质量代码和精炼的语句组成，其他的话少些。

2015.7.31

时间： 2025-01-18 10:55:21

《R语言实战》读书笔记--为什么要学的相关文章

R语言实战读书笔记(二)创建数据集

2.2.2 矩阵 matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames) 其中: byrow=TRUE/FALSE,表示按行填充还是按列填充,默认情况下是按列填充 2.2.4 数据框 1.attach,detach()和with() attach():将数据框加入搜索路径 detach():将数据框移除出搜索路径 with():赋值仅在括号内有效,如果想在括号外生效也可以,用<<- 2.

R语言实战读书笔记1—语言介绍

第一章语言介绍 1.1 典型的数据分析步骤 1.2 获取帮助 help.start() help("which") help.search("which") 1.3 管理R工作区间函数 1.3 输入和输出 1.3.1 输入函数 source("filename") 可在当前会话中执行一个脚本.如果文件名中不包含路径,R将假设此脚本在当前工作目录中.举例来说, source("1.R") 将执行包含在文件1.R中的R语句集合

R语言实战读书笔记2—创建数据集（上）

第二章创建数据集 2.1 数据集的概念不同的行业对于数据集的行和列叫法不同.统计学家称它们为观测(observation)和变量(variable) ,数据库分析师则称其为记录(record)和字段(field) ,数据挖掘/机器学习学科的研究者则把它们叫做示例(example)和属性(attribute) .如表2.1所示在表2-1所示的数据集中, PatientID 是行/实例标识符, AdmDate 是日期型变量, Age 是连续型变量, Diabetes 是名义型变量, Statu

R语言实战读书笔记2—创建数据集(下)

2.3 数据输入 2.3.1 使用键盘输入数据 2.3.2 从带分隔符的文本文件导入数据可以使用 read.table() 从带分隔符的文本文件中导入数据.此函数可读入一个表格格式的文件并将其保存为一个数据框. 其中, file 是一个带分隔符的ASCII文本文件, header 是一个表明首行是否包含了变量名的逻辑值( TRUE 或 FALSE ) , sep 用来指定分隔数据的分隔符, row.names 是一个可选参数,用以指定一个或多个表示行标识符的变量. 2.3.3 导入Excel

R语言实战读书笔记(五)高级数据管理

5.2.1 数据函数 abs: sqrt: ceiling:求不小于x的最小整数 floor:求不大于x的最大整数 trunc:向0的方向截取x中的整数部分 round:将x舍入为指定位的小数 signif:舍入为指定的有效数字位数 cos,sin,tan acos,asin,atan:反正弦,反余弦,反正切 cosh,sinh,tanh:双曲余弦,双曲正弦和双曲正切 acosh,asinh,atanh:反双曲余弦,反双曲正弦和反双曲正切 log(x,n):以n为底 log: log10: ex

R语言实战读书笔记(七)基本统计分析

summary() sapply(x,fun,options):对数据框或矩阵中的每一个向量进行统计 mean sd:标准差 var:方差 min: max: median: length: range: quantile: vars <- c("mpg", "hp", "wt")head(mtcars[vars]) summary(mtcars[vars]) mystats <- function(x, na.omit = FALS

R语言实战读书笔记(四)基本数据管理

4.2 创建新变量几个运算符: ^或**:求幂 x%%y:求余 x%/%y:整数除 4.3 变量的重编码 with(): within():可以修改数据框 4.4 变量重命名包reshape中有个函数rename,可以改名 rename(df,c(manage='managerID',date='testDate')) 或 names(df)[2]<-'newname' 4.5 缺失值 is.na():检查缺失值,是返回TRUE,否返回FALSE na.rm=TRUE选项可以用,比如 y<

R语言实战读书笔记(十三)广义线性模型

# 婚外情数据集 data(Affairs, package = "AER") summary(Affairs) table(Affairs$affairs) # 用二值变量,是或否 Affairs$ynaffair[Affairs$affairs > 0] <- 1 Affairs$ynaffair[Affairs$affairs == 0] <- 0 Affairs$ynaffair <- factor(Affairs$ynaffair, levels =

《时间序列分析及应用：R语言》读书笔记--第二章基本概念

本章介绍时间序列中的基本概念.特别地,介绍随机过程.均值.方差.协方差函数.平稳过程和自相关函数等概念. 2.1时间序列与随机过程关于随机过程的定义,本科上过相关课程,用的是<应用随机过程>清华林元烈老师的书.第1章第5节: 上面的定义比较清楚明白.按照本书上的说法,随机变量序列就是一个随机过程,换句话说,在每一个t时刻,所研究的量都是一个随机变量.随机过程完整的概率结构是由每个时刻的有限联合概率分布族决定的,幸运的是,联合分布中的大部分信息可以通过均值.方差和协方差等加以描述,而不用去直接

《时间序列分析及应用：R语言》读书笔记--第一章引论

"春节假期是难得的读书充电的时间."--转自某boss.假期能写多少算多少,一个是题目中的这本书,另一个是<python核心编程>中的高级部分,再一个是拖着的<算法导论>.

猜你喜欢

Linux 使用core file文件快速定位程序崩溃代码行

问题描述如果在 Linux下编写程序,有时运行程序的时候程序崩溃,比如说只有"Segmentation fault (core dumped) ",程序比较小的话,还可以一行一行 ...

BZOJ 1017 魔兽地图

Description DotR (Defense of the Robots) Allstars是一个风靡全球的魔兽地图,他的规则简单与同样流行的地图DotA (Defense of the Anc ...

WebService和AngularJS实现模糊过滤查询

[概要] 网上看到一个不错的帖子,用WebService获取json,然后在前端使用AngularJs进行过滤搜索,看完文章后,按自己的想法,写了一个demo,给大家讨论参考,本人技术一般,还望大家多 ...

Linux环境的压缩与解压缩

1.Compress --非常旧的一款压缩软件如果系统不支持的话可以进行简单的安装 yum install ncompress compress -rcv 文件或目录 -r 目录下的 ...

STL源码剖析 — 空间配置器(allocator)

前言以STL的实现角度而言,第一个需要介绍的就是空间配置器,因为整个STL的操作对象都存放在容器之中. 你完全可以实现一个直接向硬件存取空间的allocator. 下面介绍的是SGI STL提供的配 ...

如何让自己的网站获得过万流量

今天为大家分享一个方法,怎么样让我们的网站获得过万的流量.方法有点巧妙,但是也仅仅限于草根站长. 下面我们来看一个案例,赵本山小品网! 为什么这样的网站会有这么高的流量?因为他选了一个没人去做的词,赵 ...

树的先序遍历的栈实现

树的先序遍历的栈实现先把根节点访问了,右子树入栈,去访问左子树. 1 void preorder(tree bt) //先序遍历bt所指的二叉树 2 { 3 tree stack[n]; //栈 4 ...

SAS：保持40年持续增长，创造了数据分析的商业神话

(上图为SAS公司联合创始人兼CEO Jim Goodnight) 有这样一家神奇的软件公司,从40年前创业伊始,就专注于创造数据分析的商用消费市场,为此开发了一整套软件平台以及230多种软件产品,把 ...

【转】除了电商，为何目前“互联网＋”还没能与服装产业产生化学反应？

为什么食住行行业都在发生翻天覆地的变化,为何只有服装还没有任何动静? 其实我一直在思考这个问题,在服装行业和互联网行业呆了十多年,始终认为服装行业一定要创新,否则整个生态链通俗来说都很难赚到钱.个人认 ...

JDK1.7 HashMap 源码分析

概述 HashMap是Java里基本的存储Key.Value的一个数据类型,了解它的内部实现,可以帮我们编写出更高效的Java代码. 本文主要分析JDK1.7中HashMap实现,JDK1.8中的Ha ...

Github的最简化使用方案

临近大三结束了看到还有诸多道友还不会使用Git,甚至没去了解过GitHub,这里准备写一个简单的使用方案. Git简介: Git是一个开源的分布式版本控制系统,用以有效.高速的处理从很小到非常大的项目 ...

Install check_mk OMD package on CentOS 6.5

yum -y install time traceroute boost-program-options dialog fping graphviz graphviz-gd httpd libeven ...

数据结构导论初步理解

如今已经来到了大数据的时代,所以我们对数据的了解要更加的深刻.才可以更加理解数据这个词所代表的含义. watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/fon ...

[原创.数据可视化系列之七]阿里竞赛作品技术展示

今年9月份,数据秀(dataxiu.com)团队参与阿里和国家公共气象服务中心主办,浙江大学和阿里云承办的“公益云图数据可视化创新大赛”. “公益云图数据可视化创新大赛”将融合开放气象.空气质量监测. ...

开顶与出阳神的关系

师兄:师父好,开顶和出阳神,有直接关系吗?万行上师说,只有出来了才是修大道的开始,对吗? 师父:开顶就是出阳神,出阳神的时候就是开顶,但是你们要知道,不是出阳神之后,阳神就在法界里面修炼.那不对的,那 ...

Mysql 监控小脚本

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle公司.Mysql是最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(Relation ...

Oracle数据库恢复

建用户 wf2014 赋权限 grant dba to wf2014; 数据恢复 imp wf2014/wf2014 file=D:\wf2014.dmp full=y 参数设置: datasourc ...

java-sun.misc.BASE64Decode AccessException

在使用sun.misc中base64类时,eclipse可能会报找不到Access异常只需要修改一下访问方式即可,如下: 右键项目->属性->Javabulid path->jre ...

> Actually, the gradient function determines only the shape of the gradient, but > not its ori ...

java web邮件收发

1.网上方法要导入两个包 mail.jar&activation.jar package com.zjh.shopping.util; import java.util.Date; impor ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.017 s.