期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曹宋阳刘磊王亚刚《教育技术导刊》2018,17(12):65-68

关联规则可在大量数据中找出事务的隐藏联系,其中,Apriori算法是关联规则分析中较为有效的方法。然而,经典Apriori算法需频繁扫描数据库和事务集,使在生成频繁项集的过程中产生大量候选项集。针对该问题,利用事务集对应权重和初始数据库映射形成的布尔矩阵,在经典Apriori算法的基础上,提出一种改进算法。数值算例结果表明,改进后的算法能较为明显地减少计算时间,从而提升经典Apriori算法效率。相似文献

2.

Apriori算法的改进算法设计与分析

陈自力《闽江学院学报》2011,32(2):38-40

提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法. 相似文献

3.

一种改进的Apriori算法

李晓林王建华廖作文《教育技术导刊》2010,9(1):55-57

关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。相似文献

4.

Hadoop平台的关联挖掘算法研究

《柳州师专学报》2017,(1)

通过结合云平台的存储能力和并行处理能力,对数据挖掘的Apriori算法进行研究,把传统Apriori算法改进移植于Hadoop平台.改进后的算法在扫描一次数据库后用矩阵的形式表示事务,在生成频繁K项集的过程中只需要把满足条件的事务进行连接并统计支持度,从而减少大数据挖掘中大量无用数据的运算,提高了挖掘效率. 相似文献

5.

一种Apriori的改进算法

刘玉文陆黎明《教育技术导刊》2007,(15)

提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。相似文献

6.

一种改进的Apriori算法在web日志挖掘中的应用 总被引：1，自引：0，他引：1

罗新《韩山师范学院学报》2009,30(3):43-48

在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要. 相似文献

7.

基于概率参数的Apriori改进算法

孙帅刘子龙《教育技术导刊》2019,18(9):85-87

关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。相似文献

8.

基于有向图的频繁集挖掘算法

巫红霞谢强《湖州师范学院学报》2008,30(1):65-69

针对Apriori算法寻找频繁项集问题,提出了一种基于有向图的频繁集挖掘算法DGFM,该算法将事务数据库表示成二进制矩阵,利用有向图的思想,将频繁项的二进制位串作为有向图的权值,再将二进制矩阵用邻接表存储,通过搜索邻接表来生成频繁项集,最后试验证明该方法比Apriori算法具有更高的效率和性能. 相似文献

9.

基于项目增长法高效求解最大频繁项集 总被引：1，自引：0，他引：1

郭有强胡学钢《安徽科技学院学报》2006,20(6):62-66

针对Apriori算法存在的问题提出了一种改进方法.本算法只需对数据库一次扫描,即可得到所有频繁项集;增强了产生候选项的针对性和有效性;提高了候选项的支持事务计数的效率;在求解最大频繁项集时,由于求解过程中无需用到大量的中间结果,节省了内存空间;通过比较分析,本方法提高了挖掘效率和性能. 相似文献

10.

基于MapReduce的分块压缩矩阵Apriori的并行化研究

《西安文理学院学报》2015,(4)

针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度. 相似文献