我暂时还没有在特别有实际意义的例子中用到,先就这样吧~ 用到了再补全
因子:一个对等长的其他向量元素进行分类的向量对象。
有序因子(虽然我没看过项目中的实际用途,但是感觉像unique排序)
state <- c("tas", "sa", "qld", "nsw", "nsw", "nt", "wa", "wa",
"qld", "vic", "nsw", "vic", "qld", "qld", "sa", "tas",
"sa", "nt", "wa", "vic", "qld", "nsw", "nsw", "wa",
"sa", "act", "nsw", "vic", "vic", "act")
statef <- factor(state)
tas sa qld nsw nsw nt wa wa qld vic nsw vic qld qld sa tas sa nt
wa vic qld nsw nsw wa sa act nsw vic vic act
Levels: act nsw nt qld sa tas vic wa
levels(statef)
"act" "nsw" "nt" "qld" "sa" "tas" "vic" "wa"
incomes <- c(60, 49, 40, 61, 64, 60, 59, 54, 62, 69, 70, 42, 56, 61, 61, 61, 58, 51, 48, 65, 49, 49, 41, 48, 52, 46, 59, 46, 58, 43)
incmeans <- tapply(incomes, statef, mean) tapply虽然功能不错,但是我用sql可以更加快速和方便的完成,这里看上去显得有些鸡肋?
tapply将功能函数mean作用于statef定义域incomes上。
无序因子
在某些情况下,其实也可叫做有序因子,他可以是按照用户需要的顺序排列,而不是按照字母或其他顺序排列。
这种自然顺序的排列是有意义的。