机器学习实战(十一)使用FP-growth算法来高效发现频繁项集_小飞猪学机器学习-CSDN博客

网站介绍:文章浏览阅读198次。一、前言 上次提到可以用Apriori算法来提取频繁项集,但是Apriori算法有个致命的缺点,那就是它对每个潜在的频繁项集都需要扫描数据集判定其是否频繁,因而在时间消耗上是巨大的。据说在实际应用上一般都不用Apriori算法。 FP算法的核心就是将数据集存储在一个特定的称作FP树的结构当中。构建完FP树之后,就可以递归地在FP树上挖掘频繁项集。FP-growth算法只..._小飞猪学机器学习