推荐6个非常好的开源数据挖掘工具

1、RapidMiner

  该工具是用Java语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。

  另外,除了数据挖掘,RapidMiner还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自WEKA(一种智能分析环境)和R 脚本的学习方案、模型和算法。

  RapidMiner分布在AGPL开源许可下,可以从SourceForge上下载。SourceForge是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的MediaWiki。

  2、WEKA

  WEKA原生的非Java版本主要是为了分析农业领域数据而开发的。该工具基于Java版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与RapidMiner相比优势在于,它在GNU通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。

  WEKA支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。

  添加序列建模后,WEKA将会变得更强大,但目前不包括在内。

  3、R-Programming

  如果我告诉你R项目,一个GNU项目,是由R(R-programming简称,以下统称R)自身编写的,你会怎么想?它主要是由C语言和FORTRAN语言编写的,并且很多模块都是由R编写的,这是一款针对编程语言和软件环境进行统计计算和制图的免费软件。R语言被广泛应用于数据挖掘,以及开发统计软件和数据分析中。近年来,易用性和可扩展性也大大提高了R的知名度。

  除了数据,它还提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收集等等。

  4、Orange

  Python之所以受欢迎,是因为它简单易学并且功能强大。如果你是一个Python开发者,当涉及到需要找一个工作用的工具时,那么没有比Orange更合适的了。它是一个基于Python语言,功能强大的开源工具,并且对初学者和专家级的大神均适用。

  此外,你肯定会爱上这个工具的可视化编程和Python脚本。它不仅有机器学习的组件,还附加有生物信息和文本挖掘,可以说是充满了数据分析的各种功能。

  5、KNIME

  数据处理主要有三个部分:提取、转换和加载。 而这三者KNIME都可以做到。 KNIME为您提供了一个图形化的用户界面,以便对数据节点进行处理。它是一个开源的数据分析、报告和综合平台,同时还通过其模块化数据的流水型概念,集成了各种机器学习的组件和数据挖掘,并引起了商业智能和财务数据分析的注意。

  KNIME是基于Eclipse,用Java编写的,并且易于扩展和补充插件。其附加功能可随时添加,并且其大量的数据集成模块已包含在核心版本中。

  6、NLTK

  当涉及到语言处理任务,没有什么可以打败NLTK。NLTK提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用Python语言编写的,你可以在上面建立应用,还可以自定义它的小任务。

创意家居 http://www.biyinjishi.com/products/a65-b6550/d100137
杯子 http://www.biyinjishi.com/products/a65-b6550/d100139/
T恤衫 http://www.biyinjishi.com/products/a65-b6550/d100140/
卫衣 http://www.biyinjishi.com/products/a65-b6550/d100140/
记事本 http://www.biyinjishi.com/products/a65-b6550/d100141/
手机周边 http://www.biyinjishi.com/products/a65-b6550/d100142/
抱枕 http://www.biyinjishi.com/products/a65-b6550/d100143/
请柬 http://www.biyinjishi.com/products/a65-b6550/d100144/
贺卡 http://www.biyinjishi.com/products/a65-b6550/d100144/
文集 http://www.biyinjishi.com/products/a65-b6550/d100148/
诗集 http://www.biyinjishi.com/products/a65-b6550/d100148/
自传 http://www.biyinjishi.com/products/a65-b6550/d100148/
个人出书 http://www.biyinjishi.com/products/a65-b6580/d100144

时间: 2024-08-29 10:29:35

推荐6个非常好的开源数据挖掘工具的相关文章

7款优秀的开源数据挖掘工具

7款优秀的开源数据挖掘工具 IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看.为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集. Tanagra Tanagra (http://eric.univ-lyon2.fr/wricco/tanagra/) 是使用图形界面的数据挖掘软件,采用了类似Windows资源管

六款强大的开源数据挖掘工具推荐

当今这个大数据时代,数据就等于金钱.随着向一个基于应用的领域过渡,数据则呈现出了指数级增长.然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解.可用的结构化形式. 在数据挖掘过程中,有大量的工具可供使用,比如采用人工智能.机器学习,以及其他技术等来提取数据. 以下为您推荐六款的数据挖掘工具: 1.WEKA WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的.该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包

开源的数据挖掘工具

分享一下我老师大神的人工智能教程吧.零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!http://www.captainbed.net 本文的主要内容编译自Blaz Zupan和Janez Demsar的一篇论文(Open-Source Tools for Data Mining).我仅仅选择其中的要点和大家共享,同时加入一些个人的点评意见. 此外,对开源的数据挖掘工具有兴趣的同仁,可以关注以下OSDM09这个workshop,它会在PAKDD'09上同时进行,主要

【SPMF开源数据挖掘平台入门】MaxSP算法使用说明

前段时间,由于项目中用到了序列挖掘的算法,师兄推荐我用用SPMF.在此做个记录. 首先简单介绍一下SPMF: SPMF是一个采用Java开发的开源数据挖掘平台. 它提供了51种数据挖掘算法实现,用于: 序列模式挖掘, 关联规则挖掘, frequent itemset 挖掘, 顺序规则挖掘, 聚类 HOME PAGE:http://www.philippe-fournier-viger.com/spmf/ 首先还是学习一下序列挖掘的有关概念: 所谓序列模式,我的定义是:在一组有序的数据列组成的数据

十二个开源UML工具推荐

开源UML工具这些年发展的不错,以前那个连付费的商业UML工具也很少见的时代早已经过去.本文介绍了12个开源UML工具,功能各有一些不同,希望对读者有些帮助. AD: UML面向对象建模知识简介 UML对象关系学习总结 五个免费UML建模工具推荐 使用UML类图进行Java应用程序设计 UML基础: 统一建模语言简介 [51CTO快译]51CTO之前曾介绍过几个免费UML建模工具.本文再介绍几个免费的开源UML工具. 1. StarUML StarUML是一个开源UML项目,可以开发快速,灵活,

开源UML工具推荐

1.StarUML StarUML是一个开源UML项目,可以开发快速,灵活,可扩展,多功能并且免费的UML/MDA平台.此项目运行在Win32平台之上.StarUML项目的目标是成为RationalRose.Together等商业UML工具的替代者. 2.NetbeansUMLPlugin NetBeansUML插件目前支持以下UML图:活动图,类图,序列图,状态图,以及用例图.你可以在图编辑器中排列图,拖曳图案和类等等. 3.Acceleo Acceleo是一个代码生成器,可以将模型转换成代码

2017年最受欢迎的十大开源黑客工具

八 戒推荐一 [黑客]cracer入侵入门到精通视频教程 刚刚过去的2017年,对于大多数信息安全从业人员来说是无话可说的一年,充斥各种狗血的开脑洞的剧情,可以出问题的地方全部都出了问题,从MongoDB数据库.到WiFi安全协议.英特尔处理器漏洞.到NSA的超级武器包.僵尸摄像头.会挖矿的海盗湾.邻居胖子发明的想哭勒索病毒-万幸的是,下半场黑客实在扛不住加密货币的疯狂诱惑,忙着往恶意软件.网页.APP.固件,手机.路由器所有能放代码的地方植入矿机,转移了不少火力. 好了言归正传,以下是Dark

GitHub 上 10 款免费开源 Windows 工具

GitHub 上 10 款免费开源 Windows 工具 GitHub 是如今所有开源事物的中央仓库, 这个网站最近发布了一个叫做<2016 Octoverse  状态报告>,详细列出了从去年起其一系列亮点, 包括总的活跃用户数,最常见的 emoji 表情,最常被使用的编程语言,等等. 而最令人感到惊奇的是什么呢? 微软竟然位列总活跃贡献榜首 - 在关注量上击败了 Facebook, Google, Atom, 以及 NPM. 我觉得不可思议的就是微软这么快就可以转变思维拥抱开源.一切都是从 

数据挖掘工具R软件与Weka的比较分析

作为数据挖掘常用的两个工具软件,R软件和weka软件各有千秋,本文对这两种数据挖掘软件进行了比较与分析. R软件介绍 R是统计领域广泛使用的一款软件,是一个开放的统计分析和图形显示的程序设计环境,它与S编程语言相似. R 可以看作是贝尔实验室(Bell Laboratories)的Rick Becker,John Chambers和Allan Wilks开发的S语言的一种实现.S语言是一种用来进行数据探索.统计分析.作图的解释型语言.最初S语言的实现版本主要是S-PLUS.S-PLUS是一个商业