共查询到20条相似文献,搜索用时 15 毫秒
1.
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率. 相似文献
2.
为了提高物联网海量数据的分析处理能力,采用Apriori算法对物联网数据进行规则关联处理。首先对物联网数据进行样本划分,并采用矩阵的方式存储,接着对数据样本进行标准化处理,并得到模糊相似矩阵,最后采用Apriori算法根据频繁项集进行规则关联。本文采用基于物联网的数字图书馆作为仿真对象,对用户行为数据进行数据挖掘,实验证明,该方法完成的物联网数据规则关联,置信度高,具有一定的应用价值。 相似文献
3.
4.
Apriori算法是关联规则挖掘的一个经典算法,本文在分析关联规则挖掘算法的基础上,提出利用矩阵的数据挖掘技术对经典Apriori算法进行改进,从而提高图书馆数据资源的利用率,提高图书馆服务层次。 相似文献
5.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。 相似文献
6.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
7.
8.
关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算法采用逻辑运算方法计算项集的支持数,计算效率较高。 相似文献
9.
10.
11.
12.
刘峰 《内蒙古科技与经济》2007,(13)
本文在Apriori算法基础上,提出了基于树型数据结构的关联规则改进算法.该算法只需对数据库进行一次检索,故能大量减少所需的I/O次数,提高系统运行效率.结合人力资源管理的实践,给出了改进算法在员工绩效评价中的应用实例. 相似文献
13.
刘峰 《内蒙古科技与经济》2007,(7S):32-34
本文在Apriori算法基础上,提出了基于树型数据结构的关联规则改进算法。该算法只需对数据库进行一次检索,故能大量减少所需的I/O次数,提高系统运行效率。结合人力资源管理的实践,给出了改进算法在员工绩效评价中的应用实例。 相似文献
14.
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。 相似文献
15.
控制出生性别比是计划生育管理中的难题,如何通过对育龄妇女的信息进行处理,辅助决策人口宏观政策是政府信息化建设的更新更高目标。本文介绍了数据挖掘技术的概况,详细讨论了数据挖掘中的关联规则方法,通过引入Apriori算法并进行改进,设计一种适合目标数据库的改进算法对影响出生性别比的因素进行客观的评估,并使用相关数据进行关联规则算法的实验,找出各种因素的影响程度,实现对结果的初步分析。 相似文献
16.
数据挖掘技术是目前信息技术研究的热门问题,被广泛的应用于各个行业,但在教育领域的应用相对较少。本文对数据挖掘技术中的关联规则进行了介绍,实现了Apriori算法,并应用该算法对学生成绩进行分析,挖掘学生成绩数据中的隐藏信息,找出了各个成绩为优秀的学科之间的关联性,得出了语文、数学、英语及各文理科课程的相互影响程度,为教育管理部门提供决策支持。 相似文献
17.
18.
19.
数据挖掘算法中的关联规则算法对大量数据的项集分,可以发现它们之间存在的有意义的关联.本文将改进的Apriori算法应用于高校教务管理系统,对历届学生各门课程成绩进行了分析,探讨了高等学校课程间的相关性问题,得出了具有一定可信度和支持度的课程相关性规则,可为现行教学计划的优化和学生选课提供决策支持. 相似文献
20.
关联规则在数据挖掘中扮演着十分重要的角色,而Apriori算法和FP-growth算法是当前关联规则中两大主要算法。其中Apriori算法的主要开支是产生大量候选项集和重复遍历数据库,FP-growth算法的主要开支是重复创建和遍历条件FP树。在介绍两种算法基础上,提出了一种新的算法,使Apriori算法产生的候选项集不是查找数据库而是查找FP-tree来确定是否为频繁项集。实际测试表明,在一定的条件下,新算法的效率高于原先的两种算法。 相似文献