首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统的挖掘算法Apriori是依据统计学中的数据显著性挖掘关联规则,需多次扫描数据库,效率较低,且忽视了数据显著性与价值性不匹配的问题。针对"大数据"下容易产生数量繁多但无效的关联规则,通过采用基于布尔矩阵挖掘关联规则的算法,只扫描一次数据库,得出布尔矩阵及相应的利润矩阵,随后根据"二八法则"设定对客户最具吸引力的"最小价值度",最终挖掘出高价值的关联规则,从而提高规则挖掘的效率及价值。  相似文献   

2.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
[目的/意义]为挖掘旅游平台游记文本蕴含知识,协助旅游者高效获取符合需求的信息和知识,为制定旅游计划提供科学决策的信息支持。[方法/过程]首先面向用户需求提出基于布尔矩阵和集合逻辑改进Apriori算法的思路;然后融合命名实体识别实现了游记文本关联知识挖掘及聚合,构建了基于关联知识挖掘的个性化推荐服务模式,并以携程网中杭州相关的游记文本进行了实证研究。[结果/结论]研究发现,融合命名实体识别和改进的Apriori算法,能够有效挖掘游记文本蕴含知识,实验结果验证了在算法性能及结果上要优于传统Apriori算法,并能够根据挖掘结果向用户提供个性化推荐服务,协助旅行者科学、高效地制定旅游计划。研究结论丰富了游记文本挖掘的方法论,为旅游平台服务推荐优化提供了新的思路。  相似文献   

5.
陆觉民  郑宇 《现代情报》2007,27(12):92-93,98
Apriori算法是关联规则挖掘的一个经典算法,本文在分析关联规则挖掘算法的基础上,提出利用矩阵的数据挖掘技术对经典Apriori算法进行改进,从而提高图书馆数据资源的利用率,提高图书馆服务层次。  相似文献   

6.
通过对各届毕业生生源等特征资料、高考的成绩数据、以及大学各门课的成绩挖掘,提供了一个在教育领域进行合理挖掘的模式。研究了如何把关系数据库的关联规则问题转化为单维、布尔关联规则问题,把关联规则挖掘中的经典算法Apriori算法在实例中进行了具体应用。  相似文献   

7.
张贞梅 《中国科技信息》2007,(13):257-259,261
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。  相似文献   

8.
针对Apriori算法的存在产生大量的候选频繁集合的缺点,本文提出了基于加权代价敏感的非频过滤矩阵Apriori算法,通过在FP-tree算法的基础上构造的决策树对应的数据进行代价敏感学习;设定不同的数据的权值,设定加权置信度;非频集过滤矩阵寻找频集,生成强关联规则;构成非频集过滤Apriori算法对应的初始矩阵;构建代价敏感的非频集过滤矩阵等措施提高了算法的挖掘效果。  相似文献   

9.
陈静 《大众科技》2012,(6):46-47
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率.  相似文献   

10.
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库。算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。  相似文献   

11.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

12.
翟悦 《科教文汇》2011,(4):89-90
针对传统的Apriori算法需要产生大量的候选项目集和多次扫描数据库的不足,提出了一种新的基于内积运算的频繁项集生成算法。该算法对事务数据库布尔化表示,通过内积运算搜寻矩阵行向量直接生成频繁项集,打破了频繁项集必须从低次到高次的局限,当频繁项集可能是大项集时,大大提高了搜索效率。  相似文献   

13.
作为一种传统关联规则挖掘算法,Apriori算法存在许多可以改进的地方。比如它需要反复读取数据库,并且读取次数由项目集合中的项目的个数n来决定,I/O负载与最大频繁集中的项目个数成正相关。为改善这种状况,本文提出一种只读取一次数据库便可挖掘出关联规则的改进算法。  相似文献   

14.
针对经典Apriori算法效率上的不足,提出了一种改进的Apriori算法.通过改进的Apriori挖掘算法对股票交易数据库中的数据进行分析,找出各种股票之间的隐藏关系,挖掘出一些可靠的、合理的股票关联规则,为投资者对股票是买入还是卖出提供决策支持.实验表明,改进的算法能够快速地发现股票之间的涨跌关系,具有良好的应用效果.  相似文献   

15.
针对标准Apriori算法在旅游市场数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于动态置信和事务数据库优化的数据挖掘模型,首先采用贝叶斯算法对数据项进行预估,得到动态的置信度,然后采用m-estimate加以优化,从而让该分类能够更为精确地做出其适当的分类,最后用矩阵的形式来代替事务数据库,并通过这一方法来提高算法的运行效率。另外针对这一模型进行了仿真实验,结果发现,本文设计的经过改进的Apriori算法在挖掘市场数据的时候具有更好的性能。  相似文献   

16.
Apriori算法是关联规则挖掘的一个经典算法,针对Apriori算法的不足,提出了基于邻接矩阵的算法,该算法首先用邻接矩阵将事务数据库表示出来,然后基于邻接矩阵生成频繁k_项集。以高校图书馆借阅历史数据的挖掘为例,详细描述了事务数据库相应的邻接矩阵生成算法、k_项集生成算法以及相应的数据结构设计,算法均采用C语言描述。  相似文献   

17.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

18.
关联规则挖掘是-种主要的也是用途最广的数掘挖掘方法.本文首先对关联规则挖掘及其经典Apriori算法作了介绍,然后针对Apriori算法的缺陷,提出了一种改进的关联规则挖掘算法,充分地证明了改进算法的性能优势.  相似文献   

19.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

20.
王昱  陈仪香 《中国科技信息》2007,24(20):78-78,80
从Apriori算法可以看出,每次对数据库的扫描时,有些事务已经对频繁项目集的生成不产生作用。减少数据库内与进一步挖掘任务不相关的事务对于算法来说很有必要。本文不同于传统的事务压缩方法,设计了新的基于数据集削减法的Apriori算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号