R语言学习笔记：简单的回归分析

fitbit <- read.csv("fitbit.csv")

date cal step dist floor sit inactive walk run
1 2014年1月1日 2496 12803 9.14 15 1161 123 98 58
2 2014年1月2日 2513 12955 9.47 12 1188 112 67 73
3 2014年1月3日 2228 8768 6.31 16 1234 97 72 37
4 2014年1月4日 2336 8971 6.41 16 1140 174 113 13
5 2014年1月5日 2508 12078 9.05 8 1153 130 108 49
6 2014年1月6日 2763 15880 11.36 20 1061 177 141 61
7 2014年1月7日 2453 10895 7.78 12 1145 156 99 40
8 2014年1月8日 2449 11692 8.44 13 1164 121 118 37

attach(fitbit) #可以直接用step表示fitbit$step了

plot(step, dist)

查看step与dist的相关度，可以看出值几乎等于1，说明步数与距离是强相关。

cor(step, dist)
[1] 0.9998078

进行简单的线性回归：

dist.step <- lm(dist ~ step, fitbit)

显示dist.step的值可以看到：

Call: lm(formula = dist ~ step, data = fitbit)

Coefficients:
(Intercept) step
-0.0059966 0.0007171

说明拟合的公式为：dist = -0.0059966 + 0.0007171 * step

可以用abline函数画出拟合的直线：

abline(dist.step)

还有一个更牛的car包，可以一次性绘出更强的图形：

library(car)

scatterplot(dist ~ step, data = fitbit)

在坐标系的旁边还有箱线图，图中自动画出了拟合的直线。

可以看看卡路里消耗与步数的关系：

scatterplot(cal ~ step, data = fitbit, spread=FALSE)

可以看出这函数自动拟合了一条直线和一条曲线。

时间： 2024-12-31 03:55:07

R语言学习笔记：简单的回归分析的相关文章

R语言学习笔记

參考:W.N. Venables, D.M. Smith and the R DCT: Introduction to R -- Notes on R: A Programming Environment for Data Analysis and Graphics,2003. http://bayes.math.montana.edu/Rweb/Rnotes/R.html 前言:关于R 在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data

R语言学习笔记之可视化地研究参议员相似性

基于相似性聚类很多时候,我们想了解一群人中的一个成员与其他成员之间有多么相似.例如,假设我们是一家品牌营销公司,刚刚完成了一份挂怒有潜力新品牌的研究调查问卷.在这份调查问卷中,我们向一群人展示了新品牌的几个特征,并且要求他们对这个新品牌的每个特征按五分制打分.同时也收集了目标人群的社会经济特征,例如:年龄.性别.种族.住址的邮编以及大概的年收入. 通过这份调查问卷,我们想搞清楚品牌如何吸引不同社会经济特征的人群.最重要的是,我们想要知道这个品牌是否有很大的吸引力.换个角度想这个问题,我们想看看

R语言学习笔记2——绘图

R语言提供了非常强大的图形绘制功能.下面来看一个例子: > dose <- c(20, 30, 40, 45, 60)> drugA <- c(16, 20, 27, 40, 60)> drugB <- c(15, 18, 25, 31, 40) > plot(dose, drugA, type="b") > plot(dose, drugB, type="b") 该例中,我们引入了R语言中第一个绘图函数plot.pl

R语言学习笔记之: 论如何正确把EXCEL文件喂给R处理

前言: 应用背景兼吐槽继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. 这次的主题是论R与excel的结合,又称论如何正确把EXCEL文件喂给R处理分为: 1. xlsx包安装及注意事项 2.用vba实现xlsx批量转化csv 以及,这个的对象,针对跟我一样那些从R开始接触编程的,一直以来都是用excel做数据分析的人……编程大牛请轻拍之所以要研究这个,是因为最近工作上接了个活,要把原来在excel端的报表迁移到R端,自动输出可视化图形,并制作PDF或PPT. 这个活可以分为

R语言学习笔记（二）

今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言来描述. > vars<-c("mpg","hp","wt") > head(mtcars[vars]) mpg hp wt Mazda RX4 21.0 110 2.620 Mazda RX4 Wag 21.0 110 2.875 Datsun 710 22.8 93 2.320 Hornet 4 Drive 21.4 110 3.215 Hornet Sportab

R语言学习笔记-机器学习1-3章

在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了<机器学习-实用案例解析>这本书. 这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书中涉及11个案例.分12章.作者备注以及代码部分都讲得比较深.不过或许因为出书较早,在数据处理方面,他使用更多的是plyr包,而我用下来,dplyr包效果更好.所以许多涉及数据处理的代码,其实可以用更简洁的方法重写.但是思路却是实打实的精华. 我之前在某长途动车上啃完了前三章,两个案例.但越往后读,越觉得后面

R语言学习笔记：基础知识

1.数据分析金字塔 2.[文件]-[改变工作目录] 3.[程序包]-[设定CRAN镜像] [程序包]-[安装程序包] 4.向量 c() 例:x=c(2,5,8,3,5,9) 例:x=c(1:100) 表示把1 - 100的所有数字都给x这个变量 5.查看x的类型:>mode(x) 6.查看x的长度:>length(x) 7.将两个向量组成一个矩阵: >rbind(x1, x2) 注:r是row的意思,即行,按行组成矩阵. >cbind(x1, x2) 注c是column的意思,

R语言学习笔记——日期时间处理

一.在利用R语言实际工作中,我们经常需要将字符串转换成时间,或者将时间转化成字符串,R语言和其他语言一样,你要告诉它如何转化?也就是告诉它format,它就可以正常的转化,但是在实际中,我碰到了一下几个很难注意的问题,先总结如下: 计算机如何理解日期:日期格式(也就是Date)表示为自1970年1月1日相对的数量,较1970-01-01更早的日期表示负值.(大部分语言都是这么处理的) 大部分语言有默认的日期格式,只要按照这个日期格式去转换字符串,计算机就能正确识别.如下: <span style

R语言学习笔记之excel文件读取

在win32位的系统下,RODBC包内的函数是可以直接运行的,但在win64位的系统则不支持! 1.读取外部文件read.table()---csv,txt,excel 最基本函数是read.table(),先介绍read.table(),然后再介绍专门用来读csv的read.csv(). Description Reads a file in table format and creates a data frame from it, with cases corresponding to l

R语言学习笔记（一）

1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的函数c()可用来创建向量: a <- c(1,2,3,4,5) b <- c("one","two","three") c <- c(TRUE,FALSE,TRUE) 以上,a是数值型向量,b是字符型,c是逻辑型:注意,单个向量中元