Mining Assocaition rule algrothm(挖掘相关规则的算法)
此算法中有两个关键参数,coverage(表示预测正确的案例个数,此参数用来筛选哪些实例个数大于或等于这个值得相关规则)
accuracy(表示预测数据的精确度,此参数实际上是满足相关规则的实例的个数/满足规则前部分条件的实例个数)
A 找到满足coverage参数的所有项数的规则集合算法描述
把1赋给变量k
找到所有的满足coverage数量的k项规则集合,并且把它们保存到哈希表#1中
while 发现一些满足coverage数量的k项规则集合
k自增长
在哈希表#(k-1)中,找出所有的只在最后一项不同的k-1项集合
对于每一对创建一个k项集合,通过把两个k-1项集合组合在一起
删除所有任意的k-1项没有在哈希表#(k-1)中的k项集合
遍历数据,并且移除所有不满足coverage数量的剩下的k项集合
把剩下的k项集合和他们的coverage保存到哈希#k的表中并对每一项按语言顺序排序
B 找到k项集合中所有满足给定accuracy(正确率)的相关规则
把1赋给变量n
从k项集合中找到满足指定参数accurate的所有的n个结果的规则,并把他们保存到哈希表#1中,使用哈希表计算项集合的accuracy
while 一些满足accurate的n个结果规则被发现时
n自增长
在哈希表#(k-1)中,找出所有的只在结果最后一项不同的k-1个结果的规则
对于每一对创建一个k个结果的规则,通过把两个k-1个结果的规则组合在一起
移除哪些不满足指定accurate参数的n个结果规则,通过使用 项集合的哈希表来计算accuracy
把剩余的n个结果规则和他们的精确性保存到哈希表#k中,并对每一个结果项按照语言顺序排序
具体案例之后再补充!!!!!!!