R基础--快速探索数据(《R可视化》)

---恢复内容开始---

安装软件包并加载

> install.packages(‘gcookbook‘)

>install.packages(‘ggplot2‘)

> library(ggplot2)

或者:install.packages(‘ggplot2‘,‘gcokbook‘)

> library(gcookbook)

设置工作路径:

> setwd("d:/data")
> getwd()

[1] "d:/data"

读取文件

> data <- read.csv(‘dadtafile.csv‘)

> data
X1 X3.8.1941 X1.1.2007
1 2 1/24/1972 1/1/2007
2 3 6/1/1932 1/1/2007
3 4 5/17/1947 1/1/2007
4 5 3/10/1943 1/1/2007
5 6 1/8/1940 1/1/2007
6 7 8/5/1947 1/1/2007
7 8 4/14/2005 1/1/2007
8 9 6/23/1961 1/2/2007
9 10 1/10/1949 1/2/2007

> data <- read.csv(‘dadtafile.csv‘,header=FALSE)

> data
V1 V2 V3
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007
7 7 8/5/1947 1/1/2007
8 8 4/14/2005 1/1/2007
9 9 6/23/1961 1/2/2007
10 10 1/10/1949 1/2/2007

> head(data)
V1 V2 V3
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007

> names(data) <- c(‘Column1‘,‘Column1‘,‘Column1‘)
> data
Column1 Column1 Column1
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007
7 7 8/5/1947 1/1/2007
8 8 4/14/2005 1/1/2007
9 9 6/23/1961 1/2/2007
10 10 1/10/1949 1/2/2007
>

sep参数设置分隔符号:

> data <- read.csv(‘datafile.csv‘,sep=‘\t‘)

#制表符 使用  \t

读入的字符型比如:china会被识别为因子,所以stringsAsFactors=FALSE

即:> data <- read.csv(‘dadtafile.csv‘)

> data$Sex <- factor(data$Sex)

#转换为因子

> str(data)
‘data.frame‘: 10 obs. of 3 variables:
$ Column1: int 1 2 3 4 5 6 7 8 9 10
$ Column1: Factor w/ 10 levels "1/10/1949","1/24/1972",..: 5 2 8 7 4 3 10 6 9 1
$ Column1: Factor w/ 2 levels "1/1/2007","1/2/2007": 1 1 1 1 1 1 1 1 2 2

---恢复内容结束---

---恢复内容开始---

安装软件包并加载

> install.packages(‘gcookbook‘)

>install.packages(‘ggplot2‘)

> library(ggplot2)

或者:install.packages(‘ggplot2‘,‘gcokbook‘)

> library(gcookbook)

设置工作路径:

> setwd("d:/data")
> getwd()

[1] "d:/data"

读取文件

> data <- read.csv(‘dadtafile.csv‘)

> data
X1 X3.8.1941 X1.1.2007
1 2 1/24/1972 1/1/2007
2 3 6/1/1932 1/1/2007
3 4 5/17/1947 1/1/2007
4 5 3/10/1943 1/1/2007
5 6 1/8/1940 1/1/2007
6 7 8/5/1947 1/1/2007
7 8 4/14/2005 1/1/2007
8 9 6/23/1961 1/2/2007
9 10 1/10/1949 1/2/2007

> data <- read.csv(‘dadtafile.csv‘,header=FALSE)

> data
V1 V2 V3
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007
7 7 8/5/1947 1/1/2007
8 8 4/14/2005 1/1/2007
9 9 6/23/1961 1/2/2007
10 10 1/10/1949 1/2/2007

> head(data)
V1 V2 V3
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007

> names(data) <- c(‘Column1‘,‘Column1‘,‘Column1‘)
> data
Column1 Column1 Column1
1 1 3/8/1941 1/1/2007
2 2 1/24/1972 1/1/2007
3 3 6/1/1932 1/1/2007
4 4 5/17/1947 1/1/2007
5 5 3/10/1943 1/1/2007
6 6 1/8/1940 1/1/2007
7 7 8/5/1947 1/1/2007
8 8 4/14/2005 1/1/2007
9 9 6/23/1961 1/2/2007
10 10 1/10/1949 1/2/2007
>

sep参数设置分隔符号:

> data <- read.csv(‘datafile.csv‘,sep=‘\t‘)

#制表符 使用  \t

读入的字符型比如:china会被识别为因子,所以stringsAsFactors=FALSE

即:> data <- read.csv(‘dadtafile.csv‘)

> data$Sex <- factor(data$Sex)

#转换为因子

> str(data)
‘data.frame‘: 10 obs. of 3 variables:
$ Column1: int 1 2 3 4 5 6 7 8 9 10
$ Column1: Factor w/ 10 levels "1/10/1949","1/24/1972",..: 5 2 8 7 4 3 10 6 9 1
$ Column1: Factor w/ 2 levels "1/1/2007","1/2/2007": 1 1 1 1 1 1 1 1 2 2

read.table()

read.xlsx()

install.packages(xlsx)

library(xlsx)

library()若不成功,则参考:https://wenku.baidu.com/view/1bc6610ece2f0066f433229f.html

下载java:https://www.java.com/en/download/manual.jsp

> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
>

> plot(wt,mpg)
Error in plot(wt, mpg) : object ‘wt‘ not found
> attach(mtcars)
> plot(wt,mpg)
> detach(mtcars)
>#par函数可实现一页多图,颜色。粗细等...

ggplot2中:

> library(ggplot2)
> attach(mtcars)

> qplot(wt,mpg)
> detach(mtcars)

等价于:

> qplot(wt,mpg,data=mtcars)

等价于:
> ggplot(mtcars,aes(x=wt,y=mpg))+geom_point()

> ?plot

查看帮助

Usage

plot(x, y, ...)
Arguments

x
the coordinates of points in the plot. Alternatively, a single plotting structure, function or any R object with a plot method can be provided.
y
the y coordinates of points in the plot, optional if x is an appropriate structure.
...
Arguments to be passed to methods, such as graphical parameters (see par). Many methods will accept the following arguments:
type
what type of plot should be drawn. Possible types are
"p" for points,
"l" for lines,
"b" for both,
"c" for the lines part alone of "b",
"o" for both ‘overplotted’,
"h" for ‘histogram’ like (or ‘high-density’) vertical lines,
"s" for stair steps,
"S" for other steps, see ‘Details’ below,
"n" for no plotting.
All other types give a warning or an error; using, e.g., type = "punkte" being equivalent to type = "p" for S compatibility. Note that some methods, e.g. plot.factor, do not accept this.
main
an overall title for the plot: see title.
sub
a sub title for the plot: see title.
xlab
a title for the x axis: see title.
ylab
a title for the y axis: see title.
asp
the y/x aspect ratio, see plot.window.

> plot(pressure$temperature,pressure$pressure)

> plot(pressure$temperature,pressure$pressure,type="l")
>

> points(pressure$temperature,pressure$pressure)
>

> lines(pressure$temperature,pressure$pressure/2,col="red")
> points(pressure$temperature,pressure$pressure/2,col="red")
>

> qplot(pressure$temperature,pressure$pressure,geom="line")
> qplot(temperature,pressure,data=pressure,geom=c("line","point"))
等价于:
> ggplot(pressure,aes(x=temperature,y=pressure))+geom_line()+geom_point()

> data <- mtcars
> table(cyl)
cyl
4 6 8
11 7 14

#计算频数

> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1

> barplot(BOD$demand,names.arg=BOD$Time)

> barplot(table(cyl))

> qplot(BOD$Time,BOD$demand,geom="bar",stat="identity")

> qplot(factor(BOD$Time),BOD$demand,geom="bar",stat="identity")

绘制不了!

Error: stat_count() must not be used with a y aesthetic.
In addition: Warning message:
`stat` is deprecated

> qplot(mtcars$cyl)

> qplot(factor(mtcars$cyl))

> ggplot(BOD,aes(Time,demand))+geom_bar(stat = ‘identity‘)

> ggplot(BOD,aes(x=factor(Time),y=demand))+geom_bar(stat="identity")
>

https://www.cnblogs.com/lizhilei-123/p/6722116.html

ggplot2之快速作图qplot()----颜色。透明度,形状

频数条形图:

> library(ggplot2)
> ggplot(mtcars,aes(x=factor(cyl)))+geom_bar()

等价:
> qplot(factor(cyl),data=mtcars)

条形图与直方图看起来相似,但是却是不一样的,条形图的x轴是一个确定的数值,而直方图是一个区间。

> hist(mtcars$mpg,breaks=10)

#breaks=10  组距为10

> qplot(mpg,data = mtcars,binwidth=4)

或者

> ggplot(mtcars,aes(x=mpg))+geom_histogram(binwidth = 4)
>binwidth参数是调节横坐标的区间,你可以任意调节你认为合适的区间。

plot(ToothGrowth$supp, ToothGrowth$len)

boxplot(len~supp,data = ToothGrowth)

qplot(supp,len,data=ToothGrowth,geom = ‘boxplot‘)
ggplot(ToothGrowth,aes(supp,len))+geom_boxplot()
 

r code execution error???

重装吧。。。。。。。。。。

系统C盘空间容量不够。

原文地址:https://www.cnblogs.com/LXiaoQ/p/9751462.html

时间: 2024-11-04 14:35:20

R基础--快速探索数据(《R可视化》)的相关文章

R基础学习(1):R概述

R是一个有着统计分析功能及强大作图功能的软件系统,是由Ross Ihaka和Robert Gentleman共同创立.它是属于GNU系统的一个自由.免费.源代码开放的软件,同时也是一个用于统计计算和统计制图的优秀工具. 一.R的发展历史 要说R,就不得不先来说一下S语言.1980年左右,AT&T贝尔实验室设计出一种在统计领域广泛使用的S语言.S语言是一种解释型语言,被设计用来进行数据探索.统计分析和作图. S语言最初的实现版本主要是S-PLUS,它是一个基于S语言的商业软件,由MathSoft公

R语言笔记之数据篇

R语言杂七杂八 与R语言有关的应用工具 探索性数据分析 统计推断 回归分析 机器学习-分类问题 R与Rstudio的获取与安装 包package一种扩展R基本功能的机制集成了众多函数 获取包 导入包libraryname 获取帮助 R语言特点 R语言语法基础之数据篇 R语言中的数据 R语言支持的数据类型 基本数据结构 一维数据类型 向量 vocter 1创建 2提取子集 因子 factor 1创建 2提取子集 二维数据类型 矩阵 matrix 1生成矩阵 1matrix方法 2 修改dim属性来

零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习 之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如 此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺

R语言快速上手入门

R语言快速上手入门 课程学习网址:http://www.xuetuwuyou.com/course/196 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本教程深入浅出地讲解如何使用R语言玩转数据.课程中涵盖R语言编程的方方面面,内容涉及R对象的类型.R的记号体系和环境系统.自定义函数.if else语句.for循环.S3类R的包系统以及调试工具等.本课程还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能.本课程适合立志成为数据科学家的

[译]用R语言做挖掘数据《七》

时间序列与数据挖掘 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到: 1. LX终端(LXTerminal): Linux命令行终端,打开后会进入Bash环境,可以使用Linux命令2. GVim:非常好用的编辑器,最简单的用法可以参考课程Vim编辑器3. R:在命令行输入‘R’进入交互式环境,下面的代码都是在交互式环境运行4. 数据:在命令行终端输入以下命令:

一行R代码来实现繁琐的可视化

ggfortify 有着简单易用的统一的界面来用一行代码来对许多受欢迎的R软件包结果进行二维可视化的一个R工具包.这让许多的统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进行任何处理就能以 {ggplot} 的风格画出好看的图,大大地提高了工作的效率. 虽然ggfortify已经在CRAN上,但是由于最近很多的功能都还在快速增加,还是推荐大家从Github上下载和安装 library(devtools) install_github('sinhrks/ggfortify') lib

如何R语言快速上手入门

R语言快速上手入门 课程学习网址:http://www.xuetuwuyou.com/course/196 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本教程深入浅出地讲解如何使用R语言玩转数据.课程中涵盖R语言编程的方方面面,内容涉及R对象的类型.R的记号体系和环境系统.自定义函数.if else语句.for循环.S3类R的包系统以及调试工具等.本课程还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能.本课程适合立志成为数据科学家的

下载零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析,挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺省值,

R You Ready?——大数据时代下优雅、卓越的统计分析及绘图环境

作者按:本文根据去年11月份CSDN举办的“大数据技术大会”演讲材料整理,最初发表于2012年2月期<程序员>杂志. 1. 历史 R(R Development Core Team, 2011)语言由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 两人共同发明,其词法和语法分别源自 Scheme 和 S 语言,R 语言一般认为是 S 语言(John Chambers, Bell Labs, 1972)的一种方言.R 是“GNU S”, 一个自由的.有效的.用于统