高效频繁模式挖掘算法PrePost和FIN的C++源码

PrePost的C++源码见http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/prepost.cpp

算法内容参见论文:A New Algorithm for Fast Mining Frequent Itemsets Using N-Lists)

论文免费下载地址:http://info.scichina.com:8084/sciFe/EN/abstract/abstract508369.shtml  或http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm

FIN的C++源码见http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/fin.cpp

算法内容参见论文:Fast mining frequent itemsets using Nodesets,

论文下载地址:http://www.sciencedirect.com/science/article/pii/S0957417414000463http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm

这两个算法均给予我们小组提出了基于模式树节点集的新颖数据结构,它们的效率要优于传统主流挖掘算法,可以在其基础上重写所有与频繁项集挖掘相关的任务,如闭模式、最长模式和TOP-K模式等等。

时间: 2024-11-13 10:14:54

高效频繁模式挖掘算法PrePost和FIN的C++源码的相关文章

【甘道夫】并行化频繁模式挖掘算法FP Growth及其在Mahout下的命令使用

今天调研了并行化频繁模式挖掘算法PFP Growth及其在Mahout下的命令使用,简单记录下试验结果,供以后查阅: 环境:Jdk1.7 + Hadoop2.2.0单机伪集群 +  Mahout0.6(0.8和0.9版本都不包含该算法.Mahout0.6可以和Hadoop2.2.0和平共处有点意外orz) 部分输入数据,输入数据一行代表一个购物篮: 4750,19394,25651,6395,5592 26180,10895,24571,23295,20578,27791,2729,8637 7

静态频繁子图挖掘算法用于动态网络——gSpan算法研究

摘要 随着信息技术的不断发展,人类可以很容易地收集和储存大量的数据,然而,如何在海量的数据中提取对用户有用的信息逐渐地成为巨大挑战.为了应对这种挑战,数据挖掘技术应运而生,成为了最近一段时期数据科学的和人工智能领域内的研究热点.数据集中的频繁模式作为一种有价值的信息,受到了人们的广泛关注,成为了数据挖掘技术研究领域内的热门话题和研究重点. 传统的频繁模式挖掘技术被用来在事务数据集中发现频繁项集,然而随着数据挖掘技术应用到非传统领域,单纯的事务数据结构很难对新的领域的数据进行有效的建模.因此,频繁

gSpan频繁子图挖掘算法

参考资料:http://www.cs.ucsb.edu/~xyan/papers/gSpan.pdf http://www.cs.ucsb.edu/~xyan/papers/gSpan-short.pdf http://www.jos.org.cn/1000-9825/18/2469.pdf http://blog.csdn.net/coolypf/article/details/8263176 更多挖掘算法:https://github.com/linyiqun/DataMiningAlgor

抱米交易钱包系统模式APP开发,抱米钱包系统源码

抱米交易钱包系统模式APP开发,抱米钱包系统源码,抱米钱包系统模式抱米钱包系统开发咨询:+伍(aac1287)抱米钱包是区块链的一种,具体是什么样子的,接下来给大家介绍一下: 壹.抱米钱包系统的,模式1.分享奖励加速0.05-0.08(举例你推荐一个1万,有500-800的奖金)2.兑换奖励加速15层,0.01-0.03(推荐5个普通用户以上,15层以内,任何人余额兑换积分;如兑换1万,有100-300)3.流通奖励加速15层,0.004-0.007(推荐5个普通用户以上,15层以内,任何人流通

频繁模式挖掘apriori算法介绍及Java实现

频繁模式是频繁地出现在数据集中的模式(如项集.子序列或者子结构).例如,频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合是频繁项集. 一些基本概念 支持度:support(A=>B)=P(A并B) 置信度:confidence(A=>B)=P(B|A) 频繁k项集:如果项集I的支持度满足预定义的最小支持度阈值,则称I为频繁项集,包含k个项的项集称为k项集. 算法思想 Apriori算法是Agrawal和R. Srikant于1994年提出,为布尔关联规则挖掘频繁项集的原创性算法.通过名

PHP基于MVC模式下的幕仇美食网站、源码下载

大家好,我是全微毕设团队的创始人,本团队擅长JAVA(SSM,SSH,SPRINGBOOT).PYTHON.PHP.C#.安卓等多项技术. 今天将为大家分析一个幕仇美食网站,本项目是通过MVC框架技术来进行设计和实现的,项目主要用到的技术有php,javascript,html/css等,数据库使用的是MySQL. 现如今先进科学技术高速发展,计算机技术已经被社会的各个领域广泛应用.随着计算机技术和通信技术的迅猛发展,互联网的规模也逐步增大,互联网的元素也随之逐渐增加,可以利用其发展通信,也可以

图像处理之增强---图像增强算法四种,图示与源码,包括retinex(ssr、msr、msrcr)和一种混合算法

申明:本文非笔者原创,原文转载自:http://blog.csdn.net/onezeros/article/details/6342661 两组图像:左边较暗,右边较亮 第一行是原图像,他们下面是用四种算法处理的结果 依次为: 1.一种混合算法 2.msr,multi-scale retinex 3.msrcr,multi-scale retinex with color restoration 4.ssr,single scale retinex           源码,retinex算法

PHP基于MVC模式下的停车场车位管理系统、448源码下载

大家好,我是全微毕设团队的创始人,本团队擅长JAVA(SSM,SSH,SPRINGBOOT).PYTHON.PHP.C#.安卓等多项技术. 今天将为大家分析一个停车场车位管理系,统本系统的设计是基于php+apache+mysql的方式设计,以zendstudio和mysql5.1.2为开发工具,并运用Photoshop CS6技术美化界面,辅之以CSS技术,本系统是基于面向对象编程的web应用程序.至今为止,越来越多停车场管理停车业务都已经实现了软件化的管理功能,提高了业务的运营工作效率,停车

python3,从算法的视觉上去看待geohash源码

1.geohash有什么用途呢?这几天刚好有个测试任务是关于设备信息位置处理的,里面提及到geohash:抱着测试的警觉性,打算研读一下这个geohash到底是什么?Geohash 是一种地理编码系统,地球上的任何一个物体可以通过经纬度来定位其在地球位置,而作为程序猿通过经纬度两个信息很难(或者说很麻烦)在数据层面上进行检索和比对,这个时候geohash编码系统出现了,更可以说geohash是一种算法可以把经纬度坐标转换为短字符串.当所有的位置信息都可以通过一个字符串代替时,大大提高了地址检索和