首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
本文主要研究了数据挖掘中关联规则挖掘算法的改进方法,通过分析经典的Apriori算法,找出算法的不足.提出了一种基于矩阵行向量运算的频繁集挖掘的关联规则挖掘算法思想,并对Apriori算法进行了改进。  相似文献   

2.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

3.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

4.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

5.
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用.Apriori算法是挖掘关联规则最基本,最核心的算法之一.但Apriori算法只考虑交易中项出现的频率,没有考虑事务集不同项及记录具有不同的重要性,挖掘出来的规则具有一定的局限性.针对这点不足本文提出一种记录加权关联规则挖掘,结合Apriori算法并加以改进,给出相应的New-Aproiri算法.  相似文献   

6.
本文主要阐述了关联规则的概念,并重点介绍了关联规则中的经典算法Apriori算法.利用Apriori算法.对学校教学评价进行数据挖掘,分析挖掘结果.  相似文献   

7.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

8.
针对煤炭企业采用的基于关联规则的数据挖掘技术存在的不足,文章提出了一种基于时间聚类的加权关联规则挖掘算法,分析了关联规则的基本概念,简要介绍了传统Apriori算法原理,详细介绍了基于时间聚类的加权关联规则挖掘算法原理及实现.实际应用范例表明,与Apriori算法相比,基于时间聚类的加权关联规则挖掘算法具有较高的准确性.  相似文献   

9.
关联规则挖掘算法分析与比较   总被引:2,自引:0,他引:2  
由于数据挖掘的数据量巨大,导致关联规则挖掘中产生大量的频繁项目集。在分析经典的Apriori算法和AprioriTid算法的基础上,对Apriori和AprioriTid算法进行了分析与比较,探讨了在关系数据库环境下实现关联规则挖掘的方法。  相似文献   

10.
介绍了关联规则的基本概念和分类方法,分析了典型的Apriori算法,并描述了Apriori算法的性能瓶颈与改进策略.最后展望了关联规则挖掘的进一步研究方向.  相似文献   

11.
本文在分析经典Apriori算法和FP-growth算法存在问题的基础上,提出了一种基于索引数组的频繁项集挖掘算法.该算法以Apriori算法为基础,通过引入索引数组,有效缩小了候选集的范围,同时,因无需要采用FP树的存储结构,节省内存.通过实验性能分析比较,该算法可以有效提高频繁项集挖掘效率.  相似文献   

12.
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能.  相似文献   

13.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

14.
在介绍关联规则的相关概念后分析了关联规则经典的Apriori算法,探讨了Apriori算法在某商务网站用户行为分析中的具体应用,通过Apriori算法的挖掘结果分析出用户行为特征,即用户在点击购买不同商品时存在着某种必然或者大概率事件,从而改善网站结构,提高用户满意度.  相似文献   

15.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

16.
本文针对高校数据库的特点,利用SQL语句与Apriori算法结合,提出一种基于关系数据库的关联规则挖掘算法,该算法解决了Apriori算法不适合数值型数据挖掘的问题。为了验证算法的有效性,本文将之运用于成绩数据的挖掘,得出了课程之间的关系及学生可能不合格的课程,为学生选课和学生由于成绩不合格留级、退学的预警管理提供依据。  相似文献   

17.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

18.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

19.
本文研究了论文“基于Apriori算法的水平加权关联规则挖掘”中的New-A-Apriori算法,指出了该算法的不足及错误之处,提出了一种挖掘加权频繁项集的算法MWFS。并通过具体实例说明了采用MWFS算法的挖掘过程。  相似文献   

20.
利用关联规则的Apriori数据挖掘算法及其改进算法,对电子商务中的数据进行分析挖掘。基于某电子商务网站实际数据的实验结果表明,该算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号