《R语言实战》(中文完整版)pdf

下载地址:网盘下载

基本介绍

编辑

原作名: R in Action[2]

  作者: Robert I. Kabacoff

  译者: 高涛 / 肖楠 / 陈钢

  出版社: 人民邮电出版社

  出版年: 2013-1

  页数: 388

  定价: 79.00元

  装帧: 平装

  ISBN: 978-711-529-990-1

内容简介

编辑

数据时代已经到来,但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响,相对于经验和直觉,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。

  《R语言实战》从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。

  想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧!

  《R语言实战》内容:

  R安装与操作

  数据导入/导出及格式化

  双变量关系的描述性分析

  回归分析

  模型适用性的评价方法以及结果的可视化

  用图形实现变量关系的可视化

  在给定置信度的前提下确定样本量

  高级统计分析方法和高级绘图

作者简介

编辑

Robert I. Kabacoff,R语言社区著名学习网站的幕后维护者,现为全球化开发与咨询公司Management研究集团研发副总裁。此前,Kabacoff博士是佛罗里达诺瓦东南大学的教授,讲授定量方法和统计编程的研究生课程。Kabacoff还是临床心理学博士、统计顾问,擅长数据分析,在健康、金融服务、制造业、行为科学、政府和学术界有20余年的研究和统计咨询经验。

目录

编辑

第一部分 入 门

  第1章 R语言介绍[2]

  1.1  为何要使用R?

  1.2  R的获取和安装

  1.3  R的使用

  1.3.1  新手上路

  1.3.2  获取帮助

  1.3.3  工作空间

  1.3.4  输入和输出

  1.4  包

  1.4.1  什么是包

  1.4.2  包的安装

  1.4.3  包的载入

  1.4.4  包的使用方法

  1.5  批处理

  1.6  将输出用为输入——结果的重用

  1.7  处理大数据集

  1.8  示例实践

  1.9  小结

  第2章 创建数据集

  2.1  数据集的概念

  2.2  数据结构

  2.2.1  向量

  2.2.2  矩阵

  2.2.3  数组

  2.2.4  数据框

  2.2.5  因子

  2.2.6  列表

  2.3  数据的输入

  2.3.1  使用键盘输入数据

  2.3.2  从带分隔符的文本文件导入数据

  2.3.3  导入Excel数据

  2.3.4  导入XML数据

  2.3.5  从网页抓取数据

  2.3.6  导入SPSS数据

  2.3.7  导入SAS数据

  2.3.8  导入Stata数据

  2.3.9  导入netCDF数据

  2.3.10  导入HDF5数据

  2.3.11  访问数据库管理系统

  2.3.12  通过Stat/Transfer导入数据

  2.4  数据集的标注

  2.4.1  变量标签

  2.4.2  值标签

  2.5  处理数据对象的实用函数

  2.6  小结

  第3章 图形初阶

  3.1  使用图形

  3.2  一个简单的例子

  3.3  图形参数

  3.3.1  符号和线条

  3.3.2  颜色

  3.3.3  文本属性

  3.3.4  图形尺寸与边界尺寸

  3.4  添加文本、自定义坐标轴和图例

  3.4.1  标题

  3.4.2  坐标轴

  3.4.3  参考线

  3.4.4  图例

  3.4.5  文本标注

  3.5  图形的组合

  3.6  小结

  第4章 基本数据管理

  4.1  一个示例

  4.2  创建新变量

  4.3  变量的重编码

  4.4  变量的重命名

  4.5  缺失值

  4.5.1  重编码某些值为缺失值

  4.5.2  在分析中排除缺失值

  4.6  日期值

  4.6.1  将日期转换为字符型变量

  4.6.2  更进一步

  4.7  类型转换

  4.8  数据排序

  4.9  数据集的合并

  4.9.1  添加列

  4.9.2  添加行

  4.10  数据集取子集

  4.10.1  选入(保留)变量

  4.10.2  剔除(丢弃)变量

  4.10.3  选入观测

  4.10.4  subset()函数

  4.10.5  随机抽样

  4.11  使用SQL语句操作数据框

  4.12  小结

  第5章 高级数据管理

  5.1  一个数据处理难题

  5.2  数值和字符处理函数

  5.2.1  数学函数

  5.2.2  统计函数

  5.2.3  概率函数

  5.2.4  字符处理函数

  5.2.5  其他实用函数

  5.2.6  将函数应用于矩阵和数据框

  5.3  数据处理难题的一套解决方案

  5.4  控制流

  5.4.1  重复和循环

  5.4.2  条件执行

  5.5  用户自编函数

  5.6  整合与重构

  5.6.1  转置

  5.6.2  整合数据

  5.6.3  reshape包

  5.7  小结

  第二部分 基本方法

  第6章 基本图形

  6.1  条形图

  6.1.1  简单的条形图

  6.1.2  堆砌条形图和分组条形图

  6.1.3  均值条形图

  6.1.4  条形图的微调

  6.1.5  棘状图

  6.2  饼图

  6.3  直方图

  6.4  核密度图

  6.5  箱线图

  6.5.1  使用并列箱线图进行跨组比较

  6.5.2  小提琴图

  6.6  点图

  6.7  小结

  第7章 基本统计分析

  7.1  描述性统计分析

  7.1.1  方法云集

  7.1.2  分组计算描述性统计量

  7.1.3  结果的可视化

  7.2  频数表和列联表

  7.2.1  生成频数表

  7.2.2  独立性检验

  7.2.3  相关性的度量

  7.2.4  结果的可视化

  7.2.5  将表转换为扁平格式

  7.3  相关

  7.3.1  相关的类型

  7.3.2  相关性的显著性检验

  7.3.3  相关关系的可视化

  7.4  t检验

  7.4.1  独立样本的t检验

  7.4.2  非独立样本的t检验

  7.4.3  多于两组的情况

  7.5  组间差异的非参数检验

  7.5.1  两组的比较

  7.5.2  多于两组的比较

  7.6  组间差异的可视化

  7.7  小结

  第三部分 中级方法

  第8章 回归

  8.1  回归的多面性

  8.1.1  OLS回归的适用情境

  8.1.2  基础回顾

  8.2  OLS回归

  8.2.1  用lm()拟合回归模型

  8.2.2  简单线性回归

  8.2.3  多项式回归

  8.2.4  多元线性回归

  8.2.5  有交互项的多元线性回归

  8.3  回归诊断

  8.3.1  标准方法

  8.3.2  改进的方法

  8.3.3  线性模型假设的综合验证

  8.3.4  多重共线性

  8.4  异常观测值

  8.4.1  离群点

  8.4.2  高杠杆值点

  8.4.3  强影响点

  8.5  改进措施

  8.5.1  删除观测点

  8.5.2  变量变换

  8.5.3  增删变量

  8.5.4  尝试其他方法

  8.6  选择“最佳”的回归模型

  8.6.1  模型比较

  8.6.2  变量选择

  8.7  深层次分析

  8.7.1  交叉验证

  8.7.2  相对重要性

  8.8  小结

  第9章 方差分析

  9.1  术语速成

  9.2  ANOVA模型拟合

  9.2.1  aov()函数

  9.2.2  表达式中各项的顺序

  9.3  单因素方差分析

  9.3.1  多重比较

  9.3.2  评估检验的假设条件

  9.4  单因素协方差分析

  9.4.1  评估检验的假设条件

  9.4.2  结果可视化

  9.5  双因素方差分析

  9.6  重复测量方差分析

  9.7  多元方差分析

  9.7.1  评估假设检验

  9.7.2  稳健多元方差分析

  9.8  用回归来做ANOVA

  9.9  小结

  第10章 功效分析

  10.1  假设检验速览

  10.2  用pwr包做功效分析

  10.2.1  t检验

  10.2.2  方差分析

  10.2.3  相关性

  10.2.4  线性模型

  10.2.5  比例检验

  10.2.6  卡方检验

  10.2.7  在新情况中选择合适的效应值

  10.3  绘制功效分析图形

  10.4  其他软件包

  10.5  小结

  第11章 中级绘图

  11.1  散点图

  11.1.1  散点图矩阵

  11.1.2  高密度散点图

  11.1.3  三维散点图

  11.1.4  气泡图

  11.2  折线图

  11.3  相关图

  11.4  马赛克图

  11.5  小结

  第12章 重抽样与自助法

  12.1  置换检验

  12.2  用coin包做置换检验

  12.2.1  独立两样本和K样本检验

  12.2.2  列联表中的独立性

  12.2.3  数值变量间的独立性

  12.2.4  两样本和K样本相关性检验

  12.2.5  深入探究

  12.3  lmPerm包的置换检验

  12.3.1  简单回归和多项式回归

  12.3.2  多元回归

  12.3.3  单因素方差分析和协方差分析

  12.3.4  双因素方差分析

  12.4  置换检验点评

  12.5  自助法

  12.6  boot包中的自助法

  12.6.1  对单个统计量使用自助法

  12.6.2  多个统计量的自助法

  12.7  小结

  第四部分 高级方法

  第13章 广义线性模型

  13.1  广义线性模型和glm()函数

  13.1.1  glm()函数

  13.1.2  连用的函数

  13.1.3  模型拟合和回归诊断

  13.2  Logistic回归

  13.2.1  解释模型参数

  13.2.2  评价预测变量对结果概率的影响

  13.2.3  过度离势

  13.2.4  扩展

  13.3  泊松回归

  13.3.1  解释模型参数

  13.3.2  过度离势

  13.3.3  扩展

  13.4  小结

  第14章 主成分和因子分析

  14.1  R中的主成分和因子分析

  14.2  主成分分析

  14.2.1  判断主成分的个数

  14.2.2  提取主成分

  14.2.3  主成分旋转

  14.2.4  获取主成分得分

  14.3  探索性因子分析

  14.3.1  判断需提取的公共因子数

  14.3.2  提取公共因子

  14.3.3  因子旋转

  14.3.4  因子得分

  14.3.5  其他与EFA相关的包

  14.4  其他潜变量模型

  14.5  小结

  第15章 处理缺失数据的高级方法

  15.1  处理缺失值的步骤

  15.2  识别缺失值

  15.3  探索缺失值模式

  15.3.1  列表显示缺失值

  15.3.2  图形探究缺失数据

  15.3.3  用相关性探索缺失值

  15.4  理解缺失数据的来由和影响

  15.5  理性处理不完整数据

  15.6  完整实例分析(行删除)

  15.7  多重插补

  15.8  处理缺失值的其他方法

  15.8.1  成对删除

  15.8.2  简单(非随机)插补

  15.9  小结

  第16章 高级图形进阶

  16.1  R中的四种图形系统

  16.2  lattice包

  16.2.1  条件变量

  16.2.2  面板函数

  16.2.3  分组变量

  16.2.4  图形参数

  16.2.5  页面摆放

  16.3  ggplot2包

  16.4  交互式图形

  16.4.1  与图形交互:鉴别点

  16.4.2  playwith

  16.4.3  latticist

  16.4.4  iplots包的交互图形

  16.4.5  rggobi

  16.5  小结

  后记:探索R的世界

  附录A  图形用户界面

  附录B  自定义启动环境

  附录C  从R中导出数据

  附录D  制作出版级品质的输出

  附录E  R中的矩阵运算

  附录F  本书中用到的扩展包

  附录G  处理大数据

  附录H  更新R

  参考文献

下载地址:网盘下载

时间: 2024-08-03 15:40:23

《R语言实战》(中文完整版)pdf的相关文章

STL源码剖析(中文完整版)pdf

下载地址:网盘下载 学习编程的人都知道,阅读.剖析名家代码乃是提高水平的捷径.源码之前,了无秘密.大师们的缜密思维.经验结晶.技术思路.独到风格,都原原本本体现在源码之中. 这本书所呈现的源码,使读者看到vector的实现.list的实现.heap的实现.deque的实现.Red Black tree的实现.hash table的实现.set/map的实现:看到各种算法(排序.查找.排列组合.数据移动与复制技术)的实现:甚至还能够看到底层的memory pool和高阶抽象的traits机制的实现

《R语言实战》学习笔记fourth

又拖了好久继续写R 语言的学习笔记了啊 这次到了基本数据管理了,众所周知数据准备是数据分析的最重要的前提 书本是从一个例子开始本章的内容的,例子是一个类似调查问卷的 然后把回答标为从1到5,再进行分析(这让我想到了自学SPSS 的时候啊) > manager <- c(1, 2, 3, 4, 5) > date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08&q

Hadoop实战视频教程完整版 完整的Hadoop大数据视频教程

分享一套迪伦老师的完整的Hadoop实战视频教程,教程从学习Hadoop需要的数据库.Java和Linux基础讲起,非常适合零基础的学员,课程最后结合了实战项目演练,理论结合实战,深入浅出,绝对是当前最为完整.实战的Hadoop教程. <Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量:230课时 用到技术:部署Hadoop集群 涉及项目:京东商城.百度.阿里巴巴 咨询QQ:1337192913(小公子)

C#开发课堂实录_页数447_出版日期2016.02_完整版PDF电子书下载 带索引书签目录高清版

C#开发课堂实录_页数447_出版日期2016.02_完整版PDF电子书下载 带索引书签目录高清版_13937404 下载链接  http://pan.baidu.com/s/1bo4lFzh [作 者]张冬旭,马春兴编 [丛书名]课堂实录 [形态项] 447 [出版项] 北京:清华大学出版社 , 2016.02 [ISBN号]7-302-40539-5 [中图法分类号]TP312 [原书定价]69.00 [主题词]C语言-程序设计 [参考文献格式] 张冬旭,马春兴编. C#开发课堂实录. 北京

学习响应式设计(Learning Responsive Web Design)完整版PDF

想要为平板.手机.笔记本.大屏幕设备,甚至可穿戴设备提供最优的用户体验?那就学习响应式设计吧.这是一本内容特别全面.讲解非常透彻的入门书.特别地,通过这本书不仅能迅速掌握响应式Web设计的基本原理,还能够从头到尾了解响应式设计的工作流程:从项目启动开始,到项目最终上线为止. 只要你的工作与创建.改造或者升级网站有关系,都应该看看这本书.换句话说,不仅是前端开发人员,设计师.产品经理.项目经理,甚至后端开发人员也可以通过本书掌握响应式设计的精髓所在.这本书基于响应式设计的前沿技术和社区经验写成,汇

R电子书资料《学习R》+《R语言实战第2版》+《R数据科学》学习推荐

如果没有任何编程基础,想学习如何使用R,并进行练习,建议大家看看<学习R>电子书和代码资料,上半部分主要介绍R的技术细节和使用技巧,下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程. <学习R>电子书,帮助学习编写简单的R程序,知道R语言能做什么: 1.使用向量.数组.列表.数据框和字符串等数据类型 2.掌握条件语句以及分支和循环控制语句 3.应用R的扩展包,将你自己的工作成果打包发给其他人 4.清理从各种来源导入的数据 5.通过可视化和汇总统计理解数据 6.使

R语言实战(五)方差分析与功效分析

本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ==================================================================== 方差分析: 回归分析是通过量化的预测变量来预测量化的响应变量,而解释变量里含有名义型或有序型因子变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法就是方差分析(ANOVA).因变量不只一个时,称为多元方差分析(MANOVA).有协变量时,称为协方差分析(ANCOVA)或多元协方差分析

下载零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析,挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺省值,

R入门&lt;三&gt;-R语言实战第4章基本数据管理摘要

入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好,相应的导入导出均较为方便(read.table, write等) reshape:目前用到rename函数,可以方便的对数据变量重命名 fCalendar:在日期输入处提及,据说对日期运算有奇效,但无具体示例.同理如lubridate sqldf:在数据选取处提及,可代替subset以及各种whe