地球科学中的大数据分析与挖掘算法手册
上QQ阅读APP看书,第一时间看更新

1.1.4 算法优缺点

从前文对算法的描述中可以看出,Apriori算法的优点是简单、易于理解、对数据的要求低,同时,也可以看出Apriori算法有如下缺点。

• 在每一步产生候选项集时产生太多无用的项集。

• 每次计算支持度时,都对数据库D中的全部数据进行了一次扫描比较,如果这是一个大型的数据库,则会增大计算机系统的I/O开销。

• 扫描次数等于最长的频繁项集的长度。如果最长的频繁项集很长,则Apriori需要扫描多次数据库,导致I/O开销极大,成为关联规则挖掘的主要瓶颈。