R语言入门系列1--数学狗还是做数据好了

nanana,作为一个不合格的数学专业学生,脑袋不好使,又穷逼,只好学点儿实用的东西,希望能养活自己~~~

不瞎哔哔,想做数据方面工作的时候在犹豫是学R还是学python,一点儿python基础都没有强行用了一个python爬虫,发现python还是比较的麻烦(但是还是后来还是花了一些时间学了一些python基础的语法,发现python真的很棒,但是总感觉R更加的合适,R真的是比较美妙的东西~~~)所以现在在R的路上飘渺着~~~请多指教啦!

1. R向量

我很喜欢这东西,做大物实验的时候太方便了-.-

> X1 <- c(1:20)

> x1
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20

如你所见,函数c()就是生成一个向量,1:20表示从1开始以间隔为1加到20

那么要以2为间隔加到20怎么办呢?

> x2 <- c(1:20:2)

看起来是不是很对的样子,是不是很像matlab?但是---

In 1:40:2 : numerical expression has 40 elements: only the first used

出错啦!!!问题就在于c()不能这么用!然而我并不知道为什么不能这么用。。。

正确的如下所示:

> x2 <- seq(1,20,2)

> x2
 [1]  1  3  5  7  9 11 13 15 17 19

注意哈,seq里面用的是“,”不是“:”,我在这上面踩了不少的坑=。=

那如果我想生成从1开始到100的平方呢?

>兄弟,这个还是写循环吧//我不会了额

2. 矩阵

矩阵嘛,就是一个两维的数组而已啦,但是里面的东西必须是一个类型的,比如是数值,那就都是数值,是字符,就都是字符。

> x3 <- matrix(1:20,ncol = 5,nrow = 4)
> x3
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    5    9   13   17
[2,]    2    6   10   14   18
[3,]    3    7   11   15   19
[4,]    4    8   12   16   20

据说还有什么按行按列排序,详细的就看R文档吧~~多好。

3.数据框

忘了数组(声明记得array就好)。。。没关系,直接数据框吧 data.frame(c1,c2...)

就是这么个形式,来看看实例吧

> c1 <- c(1:20)
> c2 <- seq(1,60,3)
> m <- data.frame("第一列" = c1,"第二列" = c2)
> m
   第一列 第二列
1       1      1
2       2      4
3       3      7
4       4     10
5       5     13
6       6     16
7       7     19
8       8     22
9       9     25
10     10     28
11     11     31
12     12     34
13     13     37
14     14     40
15     15     43
16     16     46
17     17     49
18     18     52
19     19     55
20     20     58

注意到没有,header是第一列、第二列,对的,就是这样标明的!

又忘了说怎么访问。。。我晕了,来乱入一段关于访问的:

> m[2,]  //访问第二行
  第一列 第二列
2      2      4
> m[,2]  //访问第二列
 [1]  1  4  7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58

> m[2,2]  //
[1] 4

ps:为什么我总是访问2....

再乱入一个plot,

> plot(m)

用R写个循环来看看!

> s[1] <- 0

> s
 [1]   0   2   5   9  14  20  27  35  44  54  65  77  90 104 119 135 152 170 189 209 230

讲道理,真心感觉这样子写循环好累啊,语句好短~~

写while的时候把小于号打成了“<-”然后进入死循环。。。直接关了进程,明天再干

时间: 2024-10-18 05:33:22

R语言入门系列1--数学狗还是做数据好了的相关文章

R语言入门心得(3) -- 向量相关

向量定义 R在实际应用中比较常用的一个对象就是向量(Vector).向量的创建格式为 向量名 = c(x1,x2,x3,…..)  或  向量名 <- c(x1,x2,x3,…..) 或  c(x1,x2,x3,…..) -> 向量名 或  Assign("向量名", c(x1,x2,x3,…..)),c()为向量赋值函数,c()可以有任意多个参数,而起返回值则是一个把这些参数首尾相连形成的向量.你可以在命令行中输入?c或者help(c)来查看函数的详细信息.例如我们要创建

R语言入门心得(1) -- 下载与安装

R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具. R 是统计领域广泛使用的诞生于1980年左右的 S 语言的一个分支.R是S语言的一种实现.S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索.统计分析.作图的解释型语言.最初S语言的实现版本主要是S-PLUS.S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善.后来Auckland大学的Robert Gentlema

R语言数据分析系列之四

R语言数据分析系列之四 -- by comaple.zhang 说到统计分析我们就离不开随机变量,所谓随机变量就是数学家们为了更好的拟合现实世界的数据而建立的数学模型.有了她我们甚至可以来预测一个网站未来几天的日访问用户,股票的未来走势等等.那么本节我们来一起探讨以下常用的函数分布,以及流程控制语句. 常见分布有:正态分布(高斯分布),指数分布,beta分布,gamma分布等. 正态分布 若随机变量X服从一个数学期望为μ.方差为σ^2的正态分布,记为N(μ,σ^2).其概率密度函数曲线,由正态分

r语言入门资料

最近有好多r语言的爱好者问我r语言的事情,在百度上简单的收一收,感觉都在扯淡,真正适合初学者入门的资料几乎没有,比如最开始用什么编辑器比较好,在哪下载,最开始学习的例子有什么?  在日本网站上反倒是找到了不少的好资料,现在吧连接给出. 統計解析 & R言語 超初心者入門資料まとめ 基本统计知识和r语言下载安装到基本语法ppt http://morizyun.github.io/blog/statistics-analysis-bigginer-r/ 各种函数用法 http://cse.naro.

R语言数据分析系列之九 - 逻辑回归

R语言数据分析系列之九 -- by comaple.zhang 本节将一下逻辑回归和R语言实现,逻辑回归(LR,LogisticRegression)其实属于广义回归模型,根据因变量的类型和服从的分布可以分为,普通多元线性回归模型,和逻辑回归,逻辑回归是指因变量是离散并且取值范围为{0,1}两类,如果离散变量取值是多项即变为 multi-class classification,所以LR模型是一个二分类模型,可以用来做CTR预测等.那么我们现在来引出逻辑回归如何做二分类问题. 问题引入 在多元线

《R语言入门》矩阵元素定义及筛选

<R语言入门>目录: 如何在Windows下安装R语言编程环境 矩阵元素定义及筛选 和向量一样,矩阵也可以做筛选.但是需要注意一下语法上的不同.下面是一个简单的例子: 以下代码用户定义一个矩阵元素变量"si",ncol=3(三列),byrow = TRUE(数据按行输入) 使用"<-"小于号减号作为操作符 si <- matrix(c(1, 1, 1, 2, 3, 1, 3, 4, 1, 5, 1, 3), ncol = 3, byrow =

R语言数据分析系列六

R语言数据分析系列六 -- by comaple.zhang 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候怎样下手分析,数据分析的第一步.探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标.经常使用的例如以下:最小值,最大值,四分位数,均值,中位数,众数,方差,标准差.极差,偏度,峰度 先来解释一下各个量得含义,浅显就不说了,这里主要说一下不常见的 众数:出现次数最多的 方差:每一个样本值与均值的差得平方和的平均数 标准差:又称均方差,是方差的二次方根.用来衡量一个数据集的

R语言数据分析系列之八

R语言数据分析系列之八 -- by comaple.zhang 再谈多项式回归,本节再次提及多项式回归分析,理解过拟合现象,并深入cross-validation(交叉验证),regularization(正则化)框架,来避免产生过拟合现象,从更加深入的角度探讨理论基础以及基于R如何将理想照进现实. 本节知识点,以及数据集生成 1,        ggplot2进行绘图; 2,        为了拟合更复杂的数据数据集采用sin函数加上服从正太分布的随机白噪声数据; 3,        poly

R语言入门心得(2) -- RStudio

RStudio是较早的跨平台的R语言开发IDE,其包含开源版和商业版,这两个版本对大多数的桌面系统都有很好的支持:在Linux的系统上,RStudio还支持搭建基于网络的RStudio Server或者RStudio Server Pro. RStudio具有如下特性: 专为R构建 1)针对R的语法高亮,代码自动完成和智能提示 2)从源代码编辑器中直接执行R 3)函数定义快速跳转 整合工作流 1)整合了R的帮助文档 2)轻松管理工程中用到的多个文件夹 3)工作空间浏览和数据浏览 高效的程序编写和