R语言概述

R是一个有着统计分析功能及强大作图功能的软件系统,是由Ross Ihaka和Robert Gentleman共同创立。它是属于GNU系统的一个自由、免费、源码开放的软件,同一时候也是一个用于统计计算和统计制图的优秀工具。

一、R的发展历史

要说R。就不得不先来说一下S语言。

1980年左右。AT&T贝尔实验室设计出一种在统计领域广泛使用的S语言。

S语言是一种解释型语言。被设计用来进行数据探索、统计分析和作图。

S语言最初的实现版本号主要是S-PLUS。它是一个基于S语言的商业软件,由MathSoft公司的统计科学部进一步完好。

后来。Auckland大学的Robert Gentleman和Ross Ihaka及其它志愿人员开发了一个R系统。

R是基于S语言的一个GNU项目。所以也能够当作S语言的一种实现。也就是说,通经常使用S语言编写的代码都能够不作改动地在R环境下执行。

正由于如此,有人说R是S-PLUS的一个“克隆”。

二、R的主要功能

R既是一种软件,也能够说是一种语言,它R是一套完整的数据处理、计算和制图软件系统。

R的主要功能包括:数据存储和处理、数组运算、统计分析、统计制图等。

此外,它提供了简便而强大的编程语言,可操纵数据的输入和输出,可实现分支、循环,也可实现用户自己定义功能。

三、R的下载与安装

R的安装文件支持多个平台。即我们能够在Windows,Linux或Mac OS X上使用R。

R安装包的下载网址是:https://cran.r-project.org/。点击该链接。能够进入如图1所看到的的页面。

图1 R安装包的展示页面

从图1中我们能够看到。R的安装包支持Windows,Linux和Mac OS X三个平台。大家能够依据自己所使用的系统选择相应的安装包。

笔者使用的是Windows系统,因此点击图1中的“Download R for Windows”,能够看到如图2所看到的的页面。

图2 Windows平台下的R安装包概况

从图2中能够看到,R的安装包分为基础包(base)、贡献包(contrib)和工具包(Rtools)。

对于刚開始学习的人来说,使用基础包就足够了。

当大家想要对R进行深入的学习的时候,再来下载贡献包(contrib)和工具包(Rtools)。

点击图2中的“base”。进入如图3所看到的的下载页面。

图3 R安装包的下载页面

点击图3中的“Download R 3.2.3 for Windows”就可以下载R的基础安装包。

安装包下载好之后。双击就可以開始安装。依照安装提示进行一步步的操作,就可以将R安装到自己的电脑上,同一时候在桌面上创建快捷方式。

首次进入R软件的界面如图4所看到的。

图4 R软件的界面

从图4能够看出,R默认的命令提示符是“>”,它表示正在等待输入命令。

四、R的基本原理

在学习R之前,我们先来了解一下R的工作原理。

我们知道,像C、C++、Java这种编程语言,我们在使用它们的时候。必须要构造一个完整的程序形式,单独输入一条命令是无法执行的。但R却不是这种。由于R是一种解释型语言。而不是编译语言,这就意味着输入的命令能够直接被执行。而不须要先构成一个完整的程序形式。R的语法也是非常之简单和直观的。

在R执行的时候,全部变量、数据、函数及结果都以对象(objects)的形式存在计算机的活动内存中,并冠有相应的名字代号。我们能够通过用一些运算符(如算术、逻辑、比較等)和一些函数来对这些对象进行操作。

关于R中的函数,我们可用图5来形象地描写叙述。

图5 R的函数

图5中的參量(arguments)可能是一些对象(如数据、方程、算式等)。有些參量在函数里被预设为缺省值。用户则可按需对其作个别的改动,所以执行一个R函数可能不须要设定不论什么參量。原因是全部的參量都能够被默觉得缺省值。当然也有可能该函数本身就不含不论什么參量。

R的具体工作原理如图6所看到的。

图6 R工作原理示意图

从图6中能够看出,在R中进行的全部操作都是针对存储在活动内存中的对象的。对数据、结果或图表的输入与输出都是通过对计算机硬盘中的文件读写而实现。用户通过输入一些命令调用函数,分析得出的结果能够被直接显示在屏幕上,也能够被存入某个对象或被写入硬盘。由于产生的结果本身就是一种对象。所以它们也能被视为数据并能像一般数据那样被处理分析。数据文件既可从本地磁盘读取也可通过网络传输从远程服务器端获得。

全部能使用的R函数都被包括在一个库(library)中,该库存放在磁盘的R_HOME/library文件夹下(R_HOME是安装R的地址,如笔者的库文件夹为:D:\Program Files\R\R-3.2.3\library)。这个文件夹下含有具有各种功能的包(packages),这些包也是依照文件夹的方式组织起来的。

在全部的包中,名为base的包能够算是R的核心。由于它内嵌了R语言中全部像数据读写与操作这些最主要的函数。

在每一个包内,都有一个子文件夹R,这个文件夹里又都含有一个与此包同名的文件(比如在包base中,有这样一个文件R_HOME/library/base/R/base),该文件正是存放全部函数的地方。

五、R的对象

在R中进行的全部操作都是针对存储在活动内存中的对象进行的。因此,对象在R中占领了核心的地位。

1.对象的命名规则

对象的名字必须是以一个字母(A-Z或a-z)开头,中间能够包括字母、数字(0-9)、点(.)及下划线(_)。

同一时候,R对象的名字是区分大写和小写的,所以像x和X就能够代表两个全然不同的对象。

2.对象的简单操作

(1)对象的赋值

一个对象能够通过赋值操作来产生。R语言中的赋值(“ssign”)符号通常是由一个尖括号与一个负号组成的箭头形标志。该符号能够是从左到右的方向。也能够相反。

比如。我们能够打开R软件的执行界面。在界面上为对象n赋值。

> n <- 15
> n
[1] 15
> 5 -> n
> n
[1] 5

执行结果行中的方括号里的数字1表示从n的第一个元素開始显示。我们能够看到。R中的对象能够直接使用,而不用像非常多编程语言那样,必须要先定义之后再使用。假设该对象已经存在,那么它曾经的值将会自己主动被新值冲掉(这点与大部分编程语言是相同的)。

(2)对象的大写和小写

之前说过,R对象的名字是区分大写和小写的,比如。我们能够为对象x和X赋不同的值。

> x <- 1
> X <- 10
> x
[1] 1
> X
[1] 10

(3)赋值方式的多样性

在R中。给对象赋值有多种形式,能够是直接赋一个数值,也能够是一个算式或一个函数的结果。

> n <- 10 + 2
> n
[1] 12
> n <- 3 + rnorm(1)
> n
[1] 3.819211
> (10 + 2) * 5
[1] 60

执行rnorm(1)将产生一个服从平均数为0、标准差为1的标准正态分布的随机变量。

我们也能够仅仅是输入函数或表达式而不把它的结果赋给某个对象,但这样在窗体中展示的结果将不会被保存到内存中。

(4)显示内存中的对象

在R中,要用分号(;)来隔开同一行中的不同命令语句。字符串类型的变量要用双引號(“”)括起来。

函数ls的功能是显示全部在内存中的对象,但仅仅会列出对象名。

> name <- "Carmen"; n1 <- 10; n2 <- 100; m <- 0.5
> ls()
 [1] "A"      "compar" "m"      "M"      "n"      "N"      "n1"     "n2"
 [9] "name"   "x"      "X"      "z"   

假设仅仅须要显示出在名称中带有某个指定字符的对象。则通过设定选项pattern(可简写为pat)来实现。

> ls(pat = "m")
[1] "compar" "m"      "name"

假设进一步限为显示在名称中以某个字母开头的对象,则可:

> ls(pat = "^m")
[1] "m"

执行函数ls.str()将会展示内存中全部对象的具体信息。

> ls.str()
A :  chr "Gomphotherium"
compar :  logi TRUE
m :  num 0.5
M : ‘data.frame‘:       1 obs. of  3 variables:
 $ n1: num 10
 $ n2: num 100
 $ m : num 0.5
n :  num 3.82
N :  num 2.1e+23
n1 :  num 10
n2 :  num 100
name :  chr "Carmen"
x :  num 1
X :  num 10
z :  cplx 0+1i

(5)删除对象

要在内存中删除某个对象。可利用函数rm。执行rm(x)将会删除对象x,执行rm(x,y)将会删除对象x和y,而执行rm(list=ls())则会删除内存中的全部对象。

当然,ls()函数中的一些选项相同也能够运用到rm中来。以选择的删除某些特定的对象,如rm(list=ls(pat=”^m”))。

3.对象的类别概览

如图7所看到的。

时间: 2025-01-02 05:03:15

R语言概述的相关文章

R语言快速上手入门

R语言快速上手入门 课程学习网址:http://www.xuetuwuyou.com/course/196 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本教程深入浅出地讲解如何使用R语言玩转数据.课程中涵盖R语言编程的方方面面,内容涉及R对象的类型.R的记号体系和环境系统.自定义函数.if else语句.for循环.S3类R的包系统以及调试工具等.本课程还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能.本课程适合立志成为数据科学家的

如何R语言快速上手入门

R语言快速上手入门 课程学习网址:http://www.xuetuwuyou.com/course/196 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本教程深入浅出地讲解如何使用R语言玩转数据.课程中涵盖R语言编程的方方面面,内容涉及R对象的类型.R的记号体系和环境系统.自定义函数.if else语句.for循环.S3类R的包系统以及调试工具等.本课程还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能.本课程适合立志成为数据科学家的

数据分析与R语言研讨班

为满足广大科研工作者在文章发表中遇到的图表处理的苦恼,让您真正了解R.使用R,给您的文章添色添彩,思数云bihadoop将于2014年11月15日举办<数据分析与R语言>研讨班,从基础入手结合实战完成您的高级制图需求.欢迎报名参加!!!!!! 主办单位:思数云服务中心 举办地:北京,北京市回龙观龙冠大厦 培训时间:第五期2014年11月1日(已结束) 第六期:2014年11月15日(报名中...) 报名截止:2014年11月11日 授课内容(部分) 等级 授课题目 授课内容 基础 R语言基础知

R语言实战(五)方差分析与功效分析

本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ==================================================================== 方差分析: 回归分析是通过量化的预测变量来预测量化的响应变量,而解释变量里含有名义型或有序型因子变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法就是方差分析(ANOVA).因变量不只一个时,称为多元方差分析(MANOVA).有协变量时,称为协方差分析(ANCOVA)或多元协方差分析

【数据分析 R语言实战】学习笔记 第四章 数据的图形描述

4.1 R绘图概述 以下两个函数,可以分别展示二维,三维图形的示例: >demo(graphics) >demo(persp) R提供了多种绘图相关的命令,可分成三类: 高级绘图命令:在图形设备上产生一个新的图区,它可能包括坐标轴.标签.标题等. 低级绘图命令:在一个己经存在的图形上加上更多的图形元素,如额外的点.线和标签. 交互式图形命令:允许交互式地用鼠标在一个已经存在的图形.上添加图形信息或者提取图形信息. 使用R语言作图,主要按照以下步骤进行: ①取原始数据,准备好绘图需要的变量. ②

《R语言实战》学习笔记seventh

由于在准备软考中级数据库系统工程师外加巩固SQL Server 2012,所以拖了好久一直没继续学R 下去 所以今天重开R 的战事 这次是关于基本统计分析的内容,即关于用于生成基本的描述性统计量和推断统计量的R 函数 首先,将着眼于定量变量的位置和尺度的衡量方式 然后将是生成类别型变量的频数表和列联表的方法(以及连带的卡方检验) 接下来将考察连续型和有序型变量相关系数的多种形式 最后转而通过参数检验(t检验)和非参数检验(Mann-Whitney U检验.Kruskal-Wallis检验)方法研

第一章:C语言概述及如何上机运行C程序

第一章:C语言概述及如何上机运行C程序 让编程改变世界 Change the world by program C语言概述 C语言的发展过程 C语言是在 70 年代初问世的.一九七八年由美国电话电报公司(AT&T)贝尔实验室正式发表了C语言.同时由B.W.Kernighan和D.M.Ritchit合著了著名的“THE C PROGRAMMING LANGUAGE”一书.通常简称为<K&R>,也有人称之为<K&R>标准.但是,在<K&R>中

主成分分析(PCA)原理及R语言实现

原理: 主成分分析 - stanford 主成分分析法 - 智库 主成分分析(Principal Component Analysis)原理 主成分分析及R语言案例 - 文库 主成分分析法的原理应用及计算步骤 - 文库 主成分分析之R篇 [机器学习算法实现]主成分分析(PCA)——基于python+numpy scikit-learn中PCA的使用方法 Python 主成分分析PCA 机器学习实战-PCA主成分分析.降维(好) 关于主成分分析的五个问题 主成分分析(PCA)原理详解(推荐) 多变

《数据挖掘:R语言实战》

<数据挖掘:R语言实战> 基本信息 作者: 黄文    王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版日期:2014 年6月 开本:16开 页码:292 版次:1-1 所属分类:计算机 > 软件与程序设计 > 综合 > 高级程序语言设计 更多关于>>><数据挖掘:R语言实战> 内容简介 书籍 计算机书籍 数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景