首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

2.
Apriori算法是一种有效的关联规则挖掘算法,Apriori算法使用一种称作逐层搜索的迭代方法得到频繁项集,但是它产生大量的候选项集,还需要多次扫描数据库,每次对数据库的重复扫描非常冗长,大量的时间消耗在内存与数据库中的数据交换上。因此笔者引入了一种不产生候选项集的频繁项集挖掘算法——FP-growth算法,并对FP-growth算法的相关性质、实现作以介绍。  相似文献   

3.
关联规则可在大量数据中找出事务的隐藏联系,其中,Apriori算法是关联规则分析中较为有效的方法。然而,经典Apriori算法需频繁扫描数据库和事务集,使在生成频繁项集的过程中产生大量候选项集。针对该问题,利用事务集对应权重和初始数据库映射形成的布尔矩阵,在经典Apriori算法的基础上,提出一种改进算法。数值算例结果表明,改进后的算法能较为明显地减少计算时间,从而提升经典Apriori算法效率。  相似文献   

4.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

5.
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效可行的.  相似文献   

6.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

7.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。  相似文献   

8.
文章提出了一种基于位图矩阵技术和Apriori性质的多维关联规则改进算法.该算法利用位图矩阵技术降低扫描数据库的开销,应用Apriori性质减少频繁项集的搜索范围,从而提高算法运算速度.实践表明,该算法是一种有效的多维关联规则算法,具有较好的性能.  相似文献   

9.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

10.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

11.
数据挖掘是目前数据库界广泛研究的课题,而频繁项集的挖掘是关联规则挖掘、序列模式挖掘、相关分析挖掘、聚类模式挖掘和回归模式挖掘等问题中的关键步骤.该文介绍了频繁项集挖掘算法的相关概念,对目前频繁项集挖掘典型算法进行了分析和比较,并作出了适当的评价.  相似文献   

12.
随着信息技术的发展,人们之间的信息交流变得越来越频繁,移动存储设备由于具有容量大、易携带等优点,应用十分广泛。为了提高移动存储设备的安全性,设计并实现了基于虚拟盘的国密安全移动存储设备,通过在物理盘驱动程序和文件系统之间嵌入一个虚拟驱动程序,将移动存储设备中的镜像文件虚拟为一个安全分区;在移动存储设备上开辟一个隐藏区,安全区配置信息都保存在隐藏区内,并使用SM4国密算法保证数据安全性;采用多线程技术,利用CPU性能提升安全分区内文件的加解密速度。  相似文献   

13.
在AprioriTid算法的基础上提出了两点改进:一是利用压缩的候选项目集代替数据库D,减少了数据量;二是根据优化的频繁k-1项目集L’k-1来生成候选项目集Ck,避免了不必要的组合.实验证明,改进算法在缩小数据库规模方面是行之有效的.  相似文献   

14.
Students from Turkish-speaking families are the largest minority language group in Germany. Yet, little is known about this group’s literacy development. Using data from a 3-year longitudinal study, we examined whether the same base reading skills are involved in early reading comprehension of 100 Turkish-German bilingual and 69 German monolingual children. We applied a basic theoretical model of reading development to examine how emerging literacy develops for monolingual compared to bilingual children. Both the bilingual and monolingual children in this sample developed the investigated base reading skills at the same rate. However, the relations among phonological awareness, German vocabulary, and word decoding showed differential patterns in the development of German reading comprehension skills for the two groups: monolingual children appeared to make use of their phonological awareness skills more, whereas reading comprehension depended more on vocabulary skills for bilingual readers. Our findings indicate that bilingual emerging readers require specialized models of reading development to account for their unique routes into reading comprehension. The results of the study point to a need for increased attention to vocabulary building in the early phases of literacy acquisition for bilingual children.  相似文献   

15.
随着网络的发展,越来越多的用户开始考虑构建服务器,但磁盘性能不高一直是其所面临的问题。磁盘的性能与缓存速度有着密切的关联。在原有的Cache算法中引入数据压缩算法,并采用线程机制并行调度处理数据,以减少磁盘读写的I/O次数,可以提高磁盘数据读写性能,带来更高速有效的数据处理能力。  相似文献   

16.
数据库系统的可靠性是数据库系统的重要性能指标,数据库容错和故障恢复是大型数据库必备的功能。据此讨论了Sybase数据库磁盘镜像及故障恢复机制。  相似文献   

17.
潘磊 《教育技术导刊》2009,19(9):186-189
为提升电网系统日志故障诊断效率,在 Spark 环境下,基于并行 Apriori 算法构建分布式日志故障挖掘系统,针对电网系统相关设备后台日志数据,构建频繁项集并挖掘关联规则,形成系统故障规则库,用于系统故障诊断。系统对 50 万条真实日志数据进行检验。结果表明,该系统可有效发现相关故障日志。同时,该系统在 80G 内存、10 个虚拟节点的集群上以 50s 的速度完成了故障挖掘工作,准确率达 90%,同时提升了原单机系统效率,实现了预期效果。  相似文献   

18.
With increasing use of the World Wide Web, rapid scanning or skimming of material on screen has become a frequent activity. However, the outcome of this method of reading has not been thoroughly investigated. Using a range of question types, comprehension was measured after reading from screen at both a normal and fast reading speed. In addition, by automatically recording how readers scrolled through each document, reading patterns were explored. A speed‐accuracy trade‐off was found and, in general, the recall of specific details was less accurate than responses to ‘higher order’ questions. However, questions that addressed the structure of the text were hardest. Analysis of the scrolling movements showed that the overall time spent pausing between movements was the best predictor of comprehension. At a normal reading speed, the most effective readers, in terms of higher comprehension scores, were those who spent more time between scrolling movements, which were fast and frequent.  相似文献   

19.
There is growing evidence that children develop orthographic knowledge from the very beginning of literacy acquisition. This study investigated the development of German‐speaking children's orthographic knowledge with a nonword choice task. One nonword in each pair contained a frequent consonant doublet (zommul) and the other nonword contained an infrequent doublet (zobbul). Children (N = 54) performed at chance level in kindergarten but chose nonwords with frequent doublets significantly more often than expected by chance in first and second grade. Correlations between children's orthographic knowledge and their reading and spelling skills were not found. The results indicate that knowledge of frequent double consonants is evident in German‐speaking children from first grade onwards, but it is not related to their reading and spelling performance. This finding is consistent with the view that children in transparent orthographies rely less on frequent letter patterns during reading and spelling compared to children in deep orthographies.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号