weka实战003:apriori关联规则算法的实现

原创
2017/01/17 09:46
阅读数 134

weka实现的apriori算法是在weka.associations包的Apriror类。


在这个类,挖掘关联规则的入口函数是public void buildAssociations(Instances instances),而instances就是数据集,检查数据,设置参数,初始化变量,然后,用一个do-while循环计算关联规则。如果你看过上一篇,就知道其实就是从一项频繁集开始,逐级二项频繁集... N项频繁集,直到达到停止准则,终止循环。


在这个循环里,根据条件有若干种计算关联规则的方式,其中一种方式,是执行两个函数:findLargeItemSets()和findRulesBruteForce()。


findLargeItemSets()函数的作用,就是计算出所有的超过最小支持度的频繁集。所有的操作都是用集合来的,这里最重要的类就是AprioriItemSet,它做各种集合操作,也计算关联规则。


findRulesBruteForce()函数,就是暴力直接粗鲁地一个个取出前面算好的AprioriItemSet,计算关联规则。


整个过程就这么简单。






展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部