
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
6.5 本章小结
关联规则挖掘是数据挖掘诸多功能中应用最广泛的一种,关联规则描述了给定数据集的项目之间的有趣联系。这些描述可以帮助人们从更深层次认识事物之间的联系,从而帮助人们更好地从事商业活动,如对保险、证券、银行、零售等行业的客户行为模式的分析可以提高这些行业的经营效率。
在进行关联规则挖掘时,Apriori算法和FP-Growth算法是两种常用的算法。尽管Apriori算法存在一些缺点,但该算法的适应性较好,所以在实践中进行关联规则分析时首选该算法。当然也可以根据实际情况对该算法进行改进,以更好地适应新的数据和场景。FP-Growth算法具有很好的直观性,对于认识、分析、研究事物之间的关联关系非常有帮助,所以在实践中该算法可以作为与Apriori算法配合使用的算法,也可以单独使用。
对于关联规则挖掘领域的发展,笔者认为可以在如下方向上进行深入研究:在处理大量的数据时如何提高算法效率;对于迅速更新的数据的挖掘算法的进一步研究;在挖掘过程中,提供一种与用户进行交互的方法,将用户的领域知识融入其中;生成结果的可视化等。