共查询到16条相似文献,搜索用时 163 毫秒
1.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析. 相似文献
2.
关联规则挖掘在图书馆中的应用 总被引:2,自引:0,他引:2
利用数据挖掘中的关联规则技术,从大量数据中发现有价值的规则。文章用改进Apriori算法对安徽省图书馆的借阅数据进行挖掘,从中发现了一些有价值的规则,为图书馆读者服务提供指导信息。 相似文献
3.
基于Apriori改进算法的局部反馈查询扩展 总被引:1,自引:0,他引:1
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。 相似文献
4.
分析多媒体数据挖掘的需求,介绍常见的多媒体数据挖掘形式及存在问题,针对此类问题探讨基于网格环境下多媒体关联规则数据挖掘方法,该方法是Apriori算法在网格环境下的具体应用。通过实例证明该方法不仅具有经典Apriori算法的准确性,还具备网格的并行挖掘特性,可大大提高数据挖掘的速度及运算效率。 相似文献
5.
基于WEKA的高校图书馆流通数据的关联分析 总被引:2,自引:0,他引:2
马国栋 《图书馆工作与研究》2010,(12)
本文利用开源软件WEKA作为数据挖掘工具,通过Apriori算法,对高校图书馆流通历史数据进行挖掘分析,得到了很多关联规则,揭示隐藏在大量数据后的重要关系信息,并为高校图书馆开展进一步服务的各项决策提供了技术支持. 相似文献
6.
7.
为探寻当前刑事案件的发案规律与特点,以便及时预防和打击刑事犯罪,本文研究提出了刑事案件的多层关联分析模型。首先提出了刑事案件的多层关联规则挖掘的模型框架,依据所建立的刑事案件多维多层数据立方体模型,设计了层间递减支持度策略。基于经典的Apriori算法,提出了适于多层频繁谓词集搜索的改进Apriori算法,按照最小支持度与最小置信度的要求产生强关联规则。由于多层挖掘产生的规则可能存在祖孙关系,本文设计了结果分析中的减少冗余规则。最后,利用大连公安局提供的甘井子区1999~2006年的18 629条刑事案件的真实数据,验证了模型的正确性与有效性。 相似文献
8.
高校图书馆的借阅记录包含大量信息,研究数据库中的借阅记录可以获知学生与图书间的某种联系,通过改进的L-Apriori算法把这种潜在的联系转化成显性知识推荐给目标学生,对提升当前数字图书馆的服务质量具有重要意义。改进的L-Apriori算法对借阅记录分专业形成的子数据库关联规则进行逐一整合,最终形成全局数据库关联规则。实验结果表明改进的L-Apriori算法无论是挖掘效率还是准确度都明显优于Apriori算法。 相似文献
9.
高校学生成绩预警是高校教务管理的重要工作之一,研究高校学生学业预警问题在理论层面和实践指导层面均具有重要的价值。采用关联规则算法中的Apriori算法来分析厦门工学院2016级至2018级学生的成绩数据,探究每个专业各课程之间的关联度。在Matlab环境下用Apriori算法对信息与计算科学专业的学生学业成绩进行挖掘分析,发现该专业下不同课程间的关联关系,尤其是对先修课程与后继课程间的关联规则的挖掘,及时对挂科的学生预警,并同时给任课教师提供指导,从而提高教育教学管理水平。 相似文献
10.
通过对关联规则挖掘中的Apriori算法进行深入的分析与研究,为减少算法中对数据库的大量扫描操作、节省挖掘时间,提出了一种改进的Apriori算法。该算法可以提前判断算法是否应该结束,也使得算法省去了不必要的操作,节省了挖掘时间。最后通过实例分析,证明了其高效性。 相似文献
11.
介绍一种Apriori的改进算法,该算法通过寻找大于最小支持计数的最大频繁项集,可以直接得到最终频繁项集,将改进算法应用到图书馆书目推荐服务中,并对改进算法与Apriori算法进行算法的性能分析及实验数据的运行时间对比,实验证明改进算法在运行速度和挖掘性能上较经典Apriori算法有显著提高。 相似文献
12.
王强 《现代图书情报技术》2008,3(8):63-69
设计并采用Java语言实现基于事务数据库标识列表的频繁项集的产生算法——TidlistApriori。通过与采用Hash-Tree的Apriori算法进行比较,表明TidlistApriori能够提高频繁项集的产生效率,可以成为主题关联挖掘的有效算法工具。 相似文献
13.
基于XML的Web日志挖掘研究* 总被引:2,自引:0,他引:2
潘有能 《现代图书情报技术》2006,1(5):62-64
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。 相似文献
14.
15.
一种快速的个性化书目推荐方法* 总被引:1,自引:0,他引:1
针对高校数字图书馆现有书目推荐方法存在的不足,提出一种快速的个性化书目推荐方法。该方法利用矩阵向量技术和压缩技术对Apriori算法进行改进,以提高数据资源的挖掘效率,然后利用改进的Apriori算法从读者的借阅记录中挖掘出图书之间的关联关系,以此为读者的借阅提供个性化的书目推荐服务。仿真结果能够证明该方法的有效性。 相似文献
16.
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法/过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。 相似文献