【转】R中有关数据挖掘的包

下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。

1、聚类

  • 常用的包: fpc,cluster,pvclust,mclust
  • 基于划分的方法: kmeans, pam, pamk, clara
  • 基于层次的方法: hclust, pvclust, agnes, diana
  • 基于模型的方法: mclust
  • 基于密度的方法: dbscan
  • 基于画图的方法: plotcluster, plot.hclust
  • 基于验证的方法: cluster.stats

2、分类

  • 常用的包:

    rpart,party,randomForest,rpartOrdinal,tree,marginTree,

    maptree,survival

  • 决策树: rpart, ctree
  • 随机森林: cforest, randomForest
  • 回归, Logistic回归, Poisson回归: glm, predict, residuals
  • 生存分析: survfit, survdiff, coxph

3、关联规则与频繁项集

  • 常用的包:

    arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则

    DRM:回归和分类数据的重复关联模型

  • APRIORI算法,广度RST算法:apriori, drm
  • ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat

4、序列模式

  • 常用的包: arulesSequences
  • SPADE算法: cSPADE

5、时间序列

  • 常用的包: timsac
  • 时间序列构建函数: ts
  • 成分分解: decomp, decompose, stl, tsr

6、统计

  • 常用的包: Base R, nlme
  • 方差分析: aov, anova
  • 密度分析: density
  • 假设检验: t.test, prop.test, anova, aov
  • 线性混合模型:lme
  • 主成分分析和因子分析:princomp

7、图表

  • 条形图: barplot
  • 饼图: pie
  • 散点图: dotchart
  • 直方图: hist
  • 密度图: densityplot
  • 蜡烛图, 箱形图 boxplot
  • QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
  • Bi-variate plot: coplot
  • 树: rpart
  • Parallel coordinates: parallel, paracoor, parcoord
  • 热图, contour: contour, filled.contour
  • 其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot, assocplot, mosaicplot
  • 保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png

8、数据操作

  • 缺失值:na.omit
  • 变量标准化:scale
  • 变量转置:t
  • 抽样:sample
  • 堆栈:stack, unstack
  • 其他:aggregate, merge, reshape

9、与数据挖掘软件Weka做接口

  • RWeka: 通过这个接口,可以在R中使用Weka的所有算法。

文章转自:http://blog.sina.com.cn/s/blog_551d7bff01015uiw.html

时间: 2024-12-28 20:56:58

【转】R中有关数据挖掘的包的相关文章

R中常用数据挖掘算法包

数据挖掘主要分为4类,即预测.分类.聚类和关联,根据不同的挖掘目的选择相应的算法.下面对R语言中常用的数据挖掘包做一个汇总: 连续因变量的预测: stats包 lm函数,实现多元线性回归 stats包 glm函数,实现广义线性回归 stats包 nls函数,实现非线性最小二乘回归 rpart包 rpart函数,基于CART算法的分类回归树模型 RWeka包 M5P函数,模型树算法,集线性回归和CART算法的优点 adabag包 bagging函数,基于rpart算法的集成算法 adabag包 b

如何在R中加载”xlsx”包

1.下载安装对应系统位数的JDK包(Java SE Development Kit) 2.完成后,安装rJava包-low-level r to Java Interface install.packages("rJava") 3.安装xlsxjars包-package required POI jars for the xlsx package install.packages("xlsxjars") 4.安装xlsx包-read,write,format Exc

R语言数据挖掘相关包总结-转帖

与数据挖掘有关或者有帮助的R包和函数的集合. 1.聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclust, agnes, diana 基于模型的方法: mclust 基于密度的方法: dbscan 基于画图的方法: plotcluster, plot.hclust 基于验证的方法: cluster.stats 2.分类 常用的包: rpart,party,rand

R语言常用数据挖掘包

今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静.决定从今天开始 ... 今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静.决定从今天 开始,只要晚上能在11点之前把

R 中同步进行的多组比较的包:npmc

方差检验可以评估组间的差异.依据检验的结果,虽然你可以拒绝不存在差异的原假设,但方差检验并没有告诉你哪些组显著地与其他组有不同.Robert 在 <R in Action>一书中推荐了一个包-npmc: 该包提供了一种非参数多组比较程序.在控制犯第一类错误的概率(发现一个事实上并不存在的差异的概率)的前提下,执行可以同步进行的多组比较,这样可以直接完成所有组之间的成对比较. 由于该包所依赖的mvtnorm包的一些更新,npmc包的最后更新版本(1.0.7)无法正确运行在R 3.0以上的版本.我

在R中使用支持向量机(SVM)进行数据挖掘(上)

在R中,可以使用e1071软件包所提供的各种函数来完成基于支持向量机的数据分析与挖掘任务.请在使用相关函数之前,安装并正确引用e1071包.该包中最重要的一个函数就是用来建立支持向量机模型的svm()函数.我们将结合后面的例子来演示它的用法. 下面这个例子中的数据源于1936年费希尔发表的一篇重要论文.彼时他收集了三种鸢尾花(分别标记为setosa.versicolor和virginica)的花萼和花瓣数据.包括花萼的长度和宽度,以及花瓣的长度和宽度.我们将根据这四个特征来建立支持向量机模型从而

在R中使用支持向量机(SVM)进行数据挖掘(下)

书接上文 在R中使用支持向量机(SVM)进行数据挖掘(上) http://blog.csdn.net/baimafujinji/article/details/49885481 第二种使用svm()函数的方式则是根据所给的数据建立模型.这种方式形式要复杂一些,但是它允许我们以一种更加灵活的方式来构建模型.它的函数使用格式如下(注意我们仅列出了其中的主要参数). svm(x, y = NULL, scale = TRUE, type = NULL, kernel = "radial",

R中实现bagging和adaboost的包

R中的adabag包均有函数实现bagging和adaboost的分类建模(另外,ipred包中的bagging()函数可以实现bagging回归).第一题就利用adabag包实现bagging和adaboost建模,并根据预测结果选择最优模型. a)      为了描述这两种方式,先利用全部数据建立模型: 利用boosting()(原来的adaboost.M1()函数)建立adaboost分类 library(adabag) a=boosting(Species~.,data=iris) #建

mac中如何卸载pkg包

一.问题背景 在mac中,安装程序有dmg和pkg两种形式.对于dmg,直接在应用程序中删除即可,但是pkg包却没有如此方便.需要通过命令行进行删除. Mac OS X 10.9.2 二.解决方案 1.打开"应用程序"->"实用工具(Utilities)"->"终端(Terminal)". 2.使用"pkgutil --pkgs"命令,列出安装了的pkg包. com.apple.pkg.IncompatibleKe