数据挖掘各种算法

作者:JLQing

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现

网址:http://blog.csdn.net/yangliuy/article/details/7494983

数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上)

http://blog.csdn.net/yangliuy/article/details/7400984

数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(下)

http://blog.csdn.net/yangliuy/article/details/7401142

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)

http://blog.csdn.net/yangliuy/article/details/7471659

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(下)

http://blog.csdn.net/yangliuy/article/details/7471839

Newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ

http://blog.csdn.net/yangliuy/article/details/8447886

数据挖掘-决策树ID3分类算法的C++实现

http://blog.csdn.net/yangliuy/article/details/7322015

时间: 2024-10-19 00:16:09

数据挖掘各种算法的相关文章

数据挖掘经典算法——先验算法

算法描述 先验算法是实现频繁项挖掘的一种经典算法,利用关联式规则不断扩展频繁项子集以获得全部的频繁项集合.解释一下关联式规则,所谓关联式是指在大量的数据中找出的项与项之间的关系.例如消费者购买了产品A,一般都会购买产品B,这就是一条关联式. 先验算法被设计用来处理包含事务的数据库,这里的每一个事务都被当成是一组项集,给定一个阈值C,我们需要找出至少出现C次的事务子集(即子项).这边这个C值就是最小支持度,规定了一个项集出现多少次才能被认为是一个频繁项. 先验算法的核心思想基于以下一个事实:一个项

数据挖掘经典算法——最大期望算法

算法定义 最大期望算法(Exception Maximization Algorithm,后文简称EM算法)是一种启发式的迭代算法,用于实现用样本对含有隐变量的模型的参数做极大似然估计.已知的概率模型内部存在隐含的变量,导致了不能直接用极大似然法来估计参数,EM算法就是通过迭代逼近的方式用实际的值带入求解模型内部参数的算法. 算法描述 算法的形式如下: 随机对参数赋予初值: While(求解参数不稳定){ E步骤:求在当前参数值和样本下的期望函数Q: M步骤:利用期望函数重新计算模型中新的估计值

大数据之路【第十四篇】:数据挖掘--推荐算法(Mahout工具)

数据挖掘---推荐算法(Mahout工具) 一.简介 Apache顶级项目(2010.4) Hadoop上的开源机器学习库 可伸缩扩展的 Java库 推荐引擎(协同过滤).聚类和分类 二.机器学习介绍 通常问题都归为这几类问题 分类问题 回归问题 聚类问题 推荐问题 三.安装方法 3.1 下载Mahout wget http://archive.apache.org/dist/mahout/0.9/mahout-distribution-0.9.tar.gz 3.2 解压 tar -zxvf m

[数据挖掘] - 聚类算法:K-means算法理解及SparkCore实现

聚类算法是机器学习中的一大重要算法,也是我们掌握机器学习的必须算法,下面对聚类算法中的K-means算法做一个简单的描述: 一.概述 K-means算法属于聚类算法中的直接聚类算法.给定一个对象(或记录)的集合,将这些对象划分为多个组或者“聚簇”,从而使同组内的对象间比较相似而不同组对象间差异比较大:换言之,聚类算法就是将相似的对象放到同一个聚簇中,而将不相似的对象放到不同的聚簇中.由于在聚类过程中不使用到类别标签,所以相似性的概念要基于对象的属性进行定义.应用不同则相似性规则和聚类算法一般不太

数据挖掘入门算法整理

最近正打算学习一些数据挖掘方面的知识,开始看了一些相关博文,但是太过零碎,一直对此没有一个较为系统的认识.周末在图书馆闲逛,偶然看见<大话数据挖掘>一书,发现讲的比较有条理,还蛮适合入门的,因此就读了两章,作此笔记.本文只是介绍了数据挖掘入门的一些算法分类,不涉及具体算法实现. 一下是整理的算法分类图: 1.关联 关联是指一个事件与另一个事件之间的依赖关系.如经典的尿布与啤酒的关系. apriori算法是最经典的关联规则算法,基本思想是:首先从事件中集中找到所有频繁出现的子集.然后在这些子集中

数据挖掘各种算法JAVA的实现方法

数据挖掘-关联分析频繁模式挖掘Apriori.FP-Growth及Eclat算法的JAVA及C++实现: 网址:http://blog.csdn.net/yangliuy/article/details/7494983 数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上) http://blog.csdn.net/yangliuy/article/details/7400984 数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类

数据挖掘(算法概要链接)

相关链接 http://blog.csdn.net/column/details/datamining.html 通俗理解LDA主题模型 http://blog.csdn.net/v_july_v/article/details/41209515 从贝叶斯方法谈到贝叶斯网络 http://blog.csdn.net/v_july_v/article/details/40984699 从拉普拉斯矩阵说到谱聚类 http://blog.csdn.net/v_july_v/article/detail

《BI那点儿事》数据挖掘各类算法——准确性验证

准确性验证示例1:——基于三国志11数据库 数据准备: 挖掘模型:依次为:Naive Bayes 算法.聚类分析算法.决策树算法.神经网络算法.逻辑回归算法.关联算法提升图: 依次排名为: 1. 神经网络算法(92.69% 0.99)2. 逻辑回归算法(92.39% 0.99)3. 决策树算法(91.19% 0.98)4. 关联算法(90.60% 0.98)5. 聚类分析算法(89.25% 0.96)6. Naive Bayes 算法(87.61 0.96) Naive Bayes算法——分类矩

数据挖掘之算法---常用挖掘算法

http://www.cnblogs.com/jerrylead/archive/2011/03/09/1978280.html 最小倒数,梯度,极值 http://blog.csdn.net/zouxy09/article/details/8195017  联合概率分类 http://www.cnblogs.com/jerrylead/archive/2011/03/05/1971903.html 判别和生成模型 http://blog.csdn.net/zc55803903/article/