首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 785 毫秒
1.
Apriori算法是关联规则中最常见的一种算法.本文简要介绍了Apriori算法的概念、基本思想与实现过程,阐述了Apriori算法的性质与步骤,并用实例演示了算法的详细过程,最后总结了Apriori算法的特点与不足之处.  相似文献   

2.
本文主要阐述了关联规则的概念,并重点介绍了关联规则中的经典算法Apriori算法.利用Apriori算法.对学校教学评价进行数据挖掘,分析挖掘结果.  相似文献   

3.
Apriori关联算法在学生成绩中的应用   总被引:4,自引:1,他引:4  
介绍了数据挖掘中关联规则的概念及经典的Apriori算法,以及Apriori算法在学生成绩中的应用.  相似文献   

4.
介绍了关联规则的基本概念和分类方法,分析了典型的Apriori算法,并描述了Apriori算法的性能瓶颈与改进策略.最后展望了关联规则挖掘的进一步研究方向.  相似文献   

5.
文章提出了一种基于位图矩阵技术和Apriori性质的多维关联规则改进算法.该算法利用位图矩阵技术降低扫描数据库的开销,应用Apriori性质减少频繁项集的搜索范围,从而提高算法运算速度.实践表明,该算法是一种有效的多维关联规则算法,具有较好的性能.  相似文献   

6.
在介绍关联规则的相关概念后分析了关联规则经典的Apriori算法,探讨了Apriori算法在某商务网站用户行为分析中的具体应用,通过Apriori算法的挖掘结果分析出用户行为特征,即用户在点击购买不同商品时存在着某种必然或者大概率事件,从而改善网站结构,提高用户满意度.  相似文献   

7.
本文将Apriori算法应用于计算机免疫系统中提取规则,并详细地给出了Apriori算法,同时由于Apriori算法需要频繁扫描数据库,运行效率比较低,从而提出了Apriori算法的三种改进策略:优化连接策略,数据划分策略和减少交易数据策略。  相似文献   

8.
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用.Apriori算法是挖掘关联规则最基本,最核心的算法之一.但Apriori算法只考虑交易中项出现的频率,没有考虑事务集不同项及记录具有不同的重要性,挖掘出来的规则具有一定的局限性.针对这点不足本文提出一种记录加权关联规则挖掘,结合Apriori算法并加以改进,给出相应的New-Aproiri算法.  相似文献   

9.
针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度.  相似文献   

10.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

11.
本文在分析经典Apriori算法和FP-growth算法存在问题的基础上,提出了一种基于索引数组的频繁项集挖掘算法.该算法以Apriori算法为基础,通过引入索引数组,有效缩小了候选集的范围,同时,因无需要采用FP树的存储结构,节省内存.通过实验性能分析比较,该算法可以有效提高频繁项集挖掘效率.  相似文献   

12.
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能.  相似文献   

13.
本文通过对Apriori算法在高校图书馆管理中的运用分析,论述了应用Apriori算法对于提升高校图书馆服务的重要作用以及Apriori算法存在的需要及时给予解决的一些缺陷。  相似文献   

14.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

15.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

16.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

17.
对数据挖掘技术关联分析Apriori算法做了介绍,并对Apriori算法做了分析,指出其在候选项集比较多的情况下效率低下的缺点,最后提出了利用建立临时数据库的方法来提高Apriori算法的效率。  相似文献   

18.
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法.  相似文献   

19.
研究实现了一种改进的Apriori算法,通过对事务集进行扫描、删除对k一项频繁集无意义的事务,降低事务处理过程中频繁的连接次数来提高算法的效率.对图书借阅相关性挖掘的实际应用表明,随着数据量的增大,改进Apriori算法的时间效率可以提高10%以上.  相似文献   

20.
提出了使用网格技术的关联规则数据挖掘及实施,并分析、比较了经典Apriori算法和分布式Apriori算法的实施结果。通过WEKA工具对预评估系统的效率评估,和中心数据库上的Apriori和先验Apriori算法性能分析。在网格环境下可以通过减少数据处理时间、资源优化、负载分担来提高计算网络的效率并减少成本,从而使用户得到计算量更大、成本更低、速度更快的计算结果。还介绍了基于网格环境的分布式Apriori关联规则算法,并解释了如何获取知识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号