R因子

factor(x = character(), levels, labels = levels,

exclude = NA, ordered = is.ordered(x), nmax = NA)

levels因子水平,如果不指定,就是x中所有不重复的值

labels水平标识名称

exclude排除哪些水平

ordered—TRUE表示有序因子,FALSE表示无序因子

nmax水平个数上限

> f<-c("Spark","RDD","Scala","MLlib","GraghX", "Spark","Scala","GraghX","Spark","Scala")

> f1<-factor(f)

> class(f1)

[1] "factor"

> str(f1)

Factor w/ 5 levels "GraghX","MLlib",..: 5 3 4 2 1 5 4 1 5 4

> length(f1)  数据长度,而不是个数

[1] 10

> f2<-factor(f,levels=c("Spark","RDD","Scala"))

> f2

[1] Spark RDD   Scala <NA>  <NA>  Spark

[7] Scala <NA>  Spark Scala

Levels: Spark RDD Scala

> f3<-factor(f,levels=c("Spark","RDD","Scala","MLlib","GraghX","Hadoop","Hive"))

> f3

[1] Spark  RDD    Scala  MLlib  GraghX

[6] Spark  Scala  GraghX Spark  Scala

7 Levels: Spark RDD Scala ... Hive

> fa<-c(1,2)

> fa1<-factor(fa,labels = c("男","女"))

> str(fa1)

Factor w/ 2 levels "男","女": 1 2

时间: 2024-08-27 09:14:00

R因子的相关文章

《R实战》读书笔记三

第二章  创建数据集 本章概要 1探索R数据结构 2使用数据编辑器 3数据导入 4数据集标注 本章所介绍内容概括如下. 两个方面的内容. 方面一:R数据结构 方面二:进入数据或者导入数据到数据结构 理解数据集 一个数据集通常由一个表格组合而成,行表示观测,列表示变量.病人的数据集如表1所示. 表1 病人数据集 数据集能够反映数据结构.数据类型和内容. 数据结构 R数据结构如图2所示. 图2:R数据结构 数据结构即数据的组织方式,R数据结构包括向量.矩阵.数组.数据框和列表等. R向量 R向量是一

Stat3—因子分析(Factor Analysis)

http://www.datasoldier.net/post/40.html http://wenku.baidu.com/view/4904e121192e45361066f522.html http://wenku.baidu.com/link?url=EwayX82S9pd1TO486JW4iEK2YEjTB-FuNiDlKeVRJ_bEJ4UfubCXbfsCErAw0ZTzfWVtFQvBCXr_7x1CclrYxRtPnVlrwFzyMqE_R9Q8dVW http://wenku

sklearn之svm-葡萄酒质量预测(2)

继续读取csv基础true_values : list, default None认为为True的值 false_values : list, default None认为为False的值 skipinitialspace : boolean, default False在分隔符之后跳过空格. skiprows : list-like or integer or callable, default None要跳过的行号(0索引)或文件开头要跳过的行数(int).如果可调用,可调用函数将根据行索引

R语言学习(5)-字符串和因子

字符串和因子 1.字符串 创建字符串 > c("HELLO","WORLD") [1] "HELLO" "WORLD" 使用paste函数连接字符串 > paste(c("hello","hi"),"world") [1] "hello world" "hi world" > paste(c("hel

R语言中的因子

因子(factor)和有序因子(ordered factor)       因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数.因子表示分类变量,有序因子表示有序变量.       生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的标签向量.1.创建一个因子.   例1:colour <- c(

R: factor &amp; list 生成和操作因子、列表

################################################### 问题:生成.操作列表 & 因子   18.4.27 怎么生成列表 list.因子 factor.,,及其相关操作 ??? 解决方案: vec = vector(length=6);  vec  #[1] FALSE FALSE FALSE FALSE FALSE FALSE #vector 函数生成一个长度为 length 的空向量,元素为FALSE.可逐个赋值.vector 函数可用来代替

R 语言数据结构 --1 向量和因子②因子-vector

2018年6月8日 今天是学习R的第二天 感觉进度有些缓慢,需要加速一下了.另外昨天貌似写的不是特别好,所以今天打算对整体编辑研究一下. 今天来学习一下 因子,首先:什么是因子?因为我们知道了R中的向量,另外因为学习过一段时间的python 所以对字典,数组什么的有理解力.那么,对于因子 我可以看成一个有一点字典味道的向量.(个人理解) 百度的定义是这样的: 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数.因子表示分类变量

R有序因子和无序因子(4)

我暂时还没有在特别有实际意义的例子中用到,先就这样吧~  用到了再补全 因子:一个对等长的其他向量元素进行分类的向量对象. 有序因子(虽然我没看过项目中的实际用途,但是感觉像unique排序) state <- c("tas", "sa", "qld", "nsw", "nsw", "nt", "wa", "wa",      "q

R语言学习(7)字符串和因子

字符串和因子 1.字符串 创建字符串 > c("Hello","World")[1] "Hello" "World" paste( ) 函数连接字符串 > c("Hello","World")[1] "Hello" "World"> paste(c("Hello","Hi"),"W