关联规则挖掘——Partition算法

关联规则就是形如A->B的表达式，A和B是整个项集中互不相交的两个子项。

关联规则挖掘的主要目的在于发现数据中有意义的关联关系。购物篮分析就是通过分析顾客的购买行为来发现不同商品之间的联系。

支持度、置信度、提升度

支持度（A->B）=|AB|/|S|

置信度（A->B）=|AB|/|A|

这个基于划分的算法先把数据库从逻辑上分成几个互不相交的块，每次单独考虑一个分块并对它生成所有的频集，然后把产生的频集合并，用来生成所有可能的频集，最后计算这些项集的支持度。这里分块的大小选择要使得每个分块可以被放入主存，每个阶段只需被扫描一次。而算法的正确性是由每一个可能的频集至少在某一个分块中是频集保证的。上面所讨论的算法是可以高度并行的，可以把每一分块分别分配给某一个处理器生成频集。产生频集的每一个循环结束后，处理器之间进行通信来产生全局的候选k-项集。通常这里的通信过程是算法执行时间的主要瓶颈；而另一方面，每个独立的处理器生成频集的时间也是一个瓶颈。其他的方法还有在多处理器之间共享一个杂凑树来产生频集。更多的关于生成频集的并行化方法可以在文献^[AS96]中找到。

时间： 2024-10-26 18:28:31

关联规则挖掘——Partition算法的相关文章

推荐系统第4周--- 基于频繁模式的推荐系统和关联规则挖掘Apriori算法

数据挖掘:关联规则挖掘关联规则挖掘:Apriori算法提高Apriori的效率基于散列的算法基于FP tree的算法

增量关联规则挖掘—FUP算法

一.背景介绍关联规则( Association rule)概念最初由Agrawal提出,是数据挖掘的一个重要研究领域, 其目的是发现数据集中有用的频繁模式. 静态关联规则挖掘,是在固定数据集和支持度下,发现数据集中的频繁项集,如 Apriori.FP-Growth.Ecalt等.现实问题中,多数时候,支持度和数据集是会发生变化的,Cheung提出了FUP (Fast UPdate)算法,主要针对数据集增大的情况,FUP算法是第一个增量关联规则挖掘算法. 二.相关定义数据集DB = {T1,T

Apriori算法--关联规则挖掘

我的数据挖掘算法代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 Apriori算法是一个经典的数据挖掘算法,Apriori的单词的意思是"先验的",说明这个算法是具有先验性质的,就是说要通过上一次的结果推导出下一次的结果,这个如何体现将会在下面的分析中会慢慢的体现出来.Apriori算法的用处是挖掘频繁项集的,频繁项集粗俗的理解就是找出经常出现的组合,然后根据这些组合最终推出我们的关联规则. Apriori算法原理 Aprio

关联规则挖掘(基本概念和Apriori算法)

关联规则挖掘的研究一直是数据挖掘领域的一个重要方向. 关联规则挖掘的目的是从大型事务数据库中挖掘出不同项目之间的关联关系 ,找出潜在的行为模式. 关联规则概念是由 Agrawal 等人在1993年率先提出的, 并随后提出了Apriori算法. 基本概念: 定义1 关联规则挖掘的事务数据库记为TDB,TDB={T1,T2,…,Tk},Tk={i1,i2,…,ip},Tk称为事务,ip称为项目. 定义2 设I={i1,i2,…,im}是TDB中全体项目组成的集合.每一个事务T是I中一组项目的集合

FP-Tree -关联规则挖掘算法

在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库.于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支本文参考地址:http://www.cnblogs.com/zhangchaoyang/articles/2198946.html

数据挖掘算法之-关联规则挖掘(Association Rule)（购物篮分析）

在各种数据挖掘算法中,关联规则挖掘算是比较重要的一种,尤其是受购物篮分析的影响,关联规则被应用到很多实际业务中,本文对关联规则挖掘做一个小的总结. 首先,和聚类算法一样,关联规则挖掘属于无监督学习方法,它描述的是在一个事物中物品间同时出现的规律的知识模式,现实生活中,比如超市购物时,顾客购买记录常常隐含着很多关联规则,比如购买圆珠笔的顾客中有65%也购买了笔记本,利用这些规则,商场人员可以很好的规划商品摆放问题: 为叙述方便,设R= { I1,I2 ......Im} 是一组物品集,W 是一组事

数据挖掘算法之关联规则挖掘（一）---apriori算法

关联规则挖掘算法在生活中的应用处处可见,几乎在各个电子商务网站上都可以看到其应用举个简单的例子如当当网,在你浏览一本书的时候,可以在页面中看到一些套餐推荐,本书+有关系的书1+有关系的书2+...+其他物品=多少￥而这些套餐就很有可能符合你的胃口,原本只想买一本书的你可能会因为这个推荐而买了整个套餐这与userCF和itemCF不同的是,前两种是推荐类似的,或者你可能喜欢的商品列表而关联规则挖掘的是n个商品是不是经常一起被购买,如果是,那个n个商品之中,有一个商品正在被浏览(有被购买的

数据挖掘系列（1）关联规则挖掘基本概念与Aprior算法

整理数据挖掘的基本概念和算法,包括关联规则挖掘.分类.聚类的常用算法,敬请期待.今天讲的是关联规则挖掘的最基本的知识. 关联规则挖掘在电商.零售.大气物理.生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法. 啤酒与尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书<啤酒与尿布>,虽然说这个故事是哈弗商学院杜撰出来的,但确实能很好的解释关联规则挖掘的原理.我们这里以一个超市购物篮迷你数据集来解释关联规则挖掘的基本概念: TID Items T1 {牛奶,面包

关联规则挖掘算法AFPIM

(参考文献来自An Efficient Approach for Maintaining Association Rules based on Adjusting FP-tree Structure Jia-Ling Koh and Shui-Feng Shieh Department of Information and Computer Education 其中有大量的删减,如果想直奔主题,看干货,可直接从3.调整FP_tree的策略开始看起@OUYM) 1.Introduction

猜你喜欢

CSS学习（一）

学习的资源 http://www.runoob.com/ 概念样式表的插入方法 (1)外部样式表(External style sheet) <head> <link rel=&q ...

centos7.3部署kvm虚拟化

一.配置yum源: 在自带的yum外,再配置个epel的yum 源. 二.安装: yum install qemu-kvm libvirt virt-install bridge-utils ...

基于fab自动化部署

fab是一个python库,强大好使,可以做很多帮助你减轻工作量的事情,比如在多台服务器上部署web项目,这里就讲讲使用它简单的方法来执行部署的过程. 关于fab的安装的基本使用,网上一搜一大把,内容 ...

启用VTX技术支持启动android的虚拟机 - 报错

第一次启用VTX技术支持启动android的虚拟机,启动时提示如下错误: Starting emulator for AVD 'AVD_for_Android_TV_1080p_by_Google'e ...

Guava中RangeMap自定义range区间

***********************************************声明*************************************************** ...

python学习--数字表达式、变量--基于python3.5.3

1.数字和表达式 1.1.1 取余(模除运算)--x%y的结果为x除以y的余数,例如注:python2.x版本整除是/,python3.x版本整除是// 1.1.2 幂(乘方)运算,例如注:幂运算 ...

redis应用场景(1)一个文字投票网站

构建一个文章投票网站,一般具备下面几个功能发布文章文章投票评分(按投票多少进行评分) 文章排序(按发布时间,按评分高低) 文章分组(如专题) ... 1.关系型数据库设计其中用户,组两个表简单化 ...

信庭嵌入式工作室-老冯终生的遗憾

未能当兵,老冯终生的遗憾. (作者冯青华信庭嵌入式工作室-主管) <转载请注名来路> 版权声明:本文为博主原创文章,未经博主允许不得转载.

2014年9月6日

1 public class Car{ 2 3 String name; 4 int age; 5 6 public Car(String name, int age){ 7 System.out.p ...

ReactNative setNativeProps

在封装原生组件的过程,如果我们希望在reactnative中触发原生的属性,但是又不需要暴露在reactnative的组件中. 那么我们就要用到setNativeProps这个方法,这个方法会直接触发 ...

背水一战 Windows 10 (26) - XAML: x:DeferLoadStrategy, x:Null

原文:背水一战 Windows 10 (26) - XAML: x:DeferLoadStrategy, x:Null [源码下载] 作者:webabcd 介绍背水一战 Windows 10 之 XA ...

python爬取京东所有iphone的价格和名称

原本想升一下级,用一下creep神马的,但是正则今天突然出了点小问题,我就生气了,就用正则抓取了一下. 这个正则可以用re.search 或者 re.findall都可以,我比较喜欢用search因为 ...

运用NPOI操作EXCEL

一.引入NPOI程序集下载地址:http://pan.baidu.com/s/1qWI3Vgo 二.运用NPOI导出成excel文件 1 protected void btnOutExcel_Cli ...

xml的信息封装到对象

1.xml文件 <?xml version="1.0" encoding="utf-8"?> <?xml-stylesheet type=&q ...

DMA为什么比轮询、中断方式性能要卓越很多？（你不懂）

本文原创为freas_1990,转载请标明出处:http://blog.csdn.net/freas_1990/article/details/35735397 如果是计算机专业出身的同学,都听过一个 ...

Oracle EBS-SQL (BOM-18):检查BOM与工艺路线对照.sql

/*有工艺路线,无BOM清单*/ select msi.segment1, msi.description from apps.BOM_OPERATIONAL_ROUTINGS bor, apps.m ...

iOS 反射函数: performSelector 和 NSInvocation

当我们有方法名和参数列表,想要动态地给对象发送消息,可用通过反射函数机制来实现,有两种常用的做法: 一.performSelector 1 - (id)performSelector:(SEL)aSe ...

使用MySQL-Cluster搭建MySQL数据库集群

1.MySQL集群的作用: - 解决访问节点的单点故障 - 数据存储节点的单点故障 - 解决数据存储节点数据备份问题 2.集群: 使用一组服务器提供相同的服务 3.关于MySQL-Cluster: M ...

安卓开发之APK安装之后自动在桌面上创建快捷图标

可以看到很多的APP在第一次运行之后就会弹出来一个Toast说什么快捷方式已创建,那么这个东西是怎么搞出来的呢很简单就下面几句话,写在这儿以后好copy 先创建一个类 1 import androi ...

HDU 1285 确定比赛名次（拓扑排序模板）

题意还是比较容易理解的,关键要看到后面的:合条件的排名可能不是唯一的,此时要求输出时编号小的队伍在前: 思路:这道题就是拓扑排序的经典应用了,用队列做的考虑优先编号小的出队就可以了. 拓扑排序: 拓扑 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.