首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 609 毫秒
1.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

2.
针对数据挖掘中的关联规则挖掘广度及效率问题,提出了一种基于免疫优化的关联规则挖掘算法.将数据原始记录和候选模式分别作为抗原和识别抗体,通过免疫聚类竞争加速克隆扩增,提高抗体成熟力及亲和性,增强候选模式支持度.在算法执行过程中,支持度大于阈值的优秀个体都将被作为记忆细胞保存下来.这样,记忆细胞所代表的模式满足最小支持度要求,可以很容易提取出也同时满足最小置信度要求的关联规则.试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,提高了所得关联规则的准确率.在高校教学质量评估及规则挖掘中体现出应用价值.  相似文献   

3.
关联规则挖掘是解决电子商务推荐问题的重要方法之一.针对传统关联规则挖掘算法在解决移动电子商务环境个性化推荐问题时反复扫描数据库,频繁项挖掘效率低,关联规则挖掘准确率低以及规则大量冗余等不足,提出一个基于事务矩阵和用户兴趣度的关联规则挖掘算法(Matrix-and-Interestingness-based Association Rules Mining,MIbARM).该算法仅需扫描一次数据库,并在挖掘过程中不断缩小算法搜索空间以避免生成冗余候选项,同时避免了冗余规则挖掘,从而提高了挖掘效率.最后,在四组人工数据和160种参数组合的数值实验环境下,引入Apriori、CBAR 及BitTableFI算法对MIbARM进行对比验证.结果表明,在不减少有趣规则的前提下,MIbARM不但可有效避免冗余候选项集的产生,而且大幅减少了冗余规则数量,极大提高了算法的搜索效率,同时提升了个性化推荐的质量,更适用于移动电子商务环境下的个性化推荐问题.  相似文献   

4.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析.  相似文献   

5.
为探寻当前刑事案件的发案规律与特点,以便及时预防和打击刑事犯罪,本文研究提出了刑事案件的多层关联分析模型。首先提出了刑事案件的多层关联规则挖掘的模型框架,依据所建立的刑事案件多维多层数据立方体模型,设计了层间递减支持度策略。基于经典的Apriori算法,提出了适于多层频繁谓词集搜索的改进Apriori算法,按照最小支持度与最小置信度的要求产生强关联规则。由于多层挖掘产生的规则可能存在祖孙关系,本文设计了结果分析中的减少冗余规则。最后,利用大连公安局提供的甘井子区1999~2006年的18 629条刑事案件的真实数据,验证了模型的正确性与有效性。  相似文献   

6.
应用社会网络分析的方法解决多属性关联规则挖掘的问题,这是解决这类问题全新的视角.首先,从啤酒的不同品牌与尿不湿不同颜色的搭配引出了多属性关联规则挖掘的问题,并指出这类问题也包含着广泛的评价和推荐问题;而后,基于社会网络分析的视角,建立了相应的图模型及与之等价的矩阵,通过对图和矩阵的分析,引出了多属性关联规则挖掘的方法;为了进一步使方法有助于程序化表达,将既有的方法通过引入"指标向量"实现了统一表达,这有助于程序递归的实现;最后,给出了本文方法的算法步骤,并将其应用在一个100 000评估量规模的数据集上对方法进行实证分析.结果表明:本文通过社会网络分析的视角将抽象的关联规则挖掘变得可视化,这便于矩阵表达的引入,使得到的方法具有算法复杂度低、直观和易于把握的特征,相比于既有的多属性关联规则挖掘算法有优势.  相似文献   

7.
贾君枝  冯婕 《图书情报工作》2017,61(12):122-128
[目的/意义] 挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程] 提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果/结论] 分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。  相似文献   

8.
高校学生成绩预警是高校教务管理的重要工作之一,研究高校学生学业预警问题在理论层面和实践指导层面均具有重要的价值。采用关联规则算法中的Apriori算法来分析厦门工学院2016级至2018级学生的成绩数据,探究每个专业各课程之间的关联度。在Matlab环境下用Apriori算法对信息与计算科学专业的学生学业成绩进行挖掘分析,发现该专业下不同课程间的关联关系,尤其是对先修课程与后继课程间的关联规则的挖掘,及时对挂科的学生预警,并同时给任课教师提供指导,从而提高教育教学管理水平。  相似文献   

9.
关联规则挖掘在图书馆中的应用   总被引:2,自引:0,他引:2  
利用数据挖掘中的关联规则技术,从大量数据中发现有价值的规则。文章用改进Apriori算法对安徽省图书馆的借阅数据进行挖掘,从中发现了一些有价值的规则,为图书馆读者服务提供指导信息。  相似文献   

10.
本文通过数据挖掘中的关联规则算法研究,经典Apfiofi算法进行分析,使用一款优秀的源数据挖掘平台WEKA,通过数据预处理属性筛选后使用Apfiofi算法进行关联规则挖掘,对专升本报名数据进行关联规则分析,挖掘存在有价值的信息,为今后院校招生专业设置等提供指导信息。  相似文献   

11.
研究利用数据挖掘中的关联规则挖掘分析及论文数据库,进行相关文献推荐,提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法,并通过用户行为分析确定相关文献集和垂直权重,采用Google搜索引擎的PageRank算法确定水平权重,获得一些有意义的分析结果。  相似文献   

12.
基于关联规则挖掘的查询扩展模型研究   总被引:1,自引:0,他引:1  
为了将关联规则挖掘技术更好地应用于信息检索查询扩展,通过对基于关联规则挖掘的查询扩展模型的深入研究,归纳出4类共13种查询扩展模型,理论分析和实验比较各个查询扩展模型的检索性能,试图发现一些优秀的扩展模型。  相似文献   

13.
关联规则挖掘算法通常生成大量的规则,但由于资源的限制,只有少量规则可能被筛选出来使用。因此关联规则的兴趣度评价成为数据挖掘领域中的一个重要问题。考虑到关联规则兴趣度评价本质上是一个多属性决策问题,本文首先基于关联规则的客观兴趣度度量和用户的主观偏好,建立了关联规则评价指标体系;然后提出一种基于组合评价方法的关联规则评价的框架及其具体实现步骤,以解决多种评价方法评价结果不一致的问题;最后以某超市购物篮数据分析为例,基于整体差异的组合评价方法实现了关联规则的组合评价以验证所提评价方法的可行性和有效性。  相似文献   

14.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

15.
一种集成客户终身价值与协同过滤的推荐方法   总被引:1,自引:0,他引:1  
提出一种加权RFM与协同过滤相结合的集成推荐方法,对由"Web数据挖掘"隐式收集的客户评价数据进行协同过滤处理,应用加权RFM对相似用户聚类结果加以改进,从而更有效地发现推荐规则,提高推荐质量。同时应用产品分类树(PT)对产品进行预处理,以减少计算空间的复杂度。实验评价结果表明该方法无论在推荐精度还是推荐相关性上都更为有效。  相似文献   

16.
关联规则是数据挖掘领域一个重要的研究任务。文章首先介绍关联规则的基本概念和常用的关联规则算法。接着以上海交通大学两年的图书流通数据为研究对象,利用关联规则和Apriori算法,分别对图书的类别和特定图书的借阅关联性做出分析,得出图书大类和一些单本图书的借阅关联性特点,最后在此基础上为图书馆工作和个性化服务提出合理建议。  相似文献   

17.
应用关联规则挖掘方法从中文社会科学引文索引(CSSCI)数据库提供的论文引用情况中挖掘关联规则,进而探讨社会科学各学科间相关性问题。本文首先介绍关联规则的基本概念;然后对所需数据进行整理,并从三个角度考虑,分别计算频繁项目的支持度与置信度,得到三个关联规则表;最后对得到的关联规则进行分析,得出结论。  相似文献   

18.
沈思 《图书情报工作》2009,53(23):111-114
为提高网络信息激增中个性化信息推荐的有效性和智能性,将关联规则技术和Multi Agent技术应用到个性化信息推荐中,设计一个通过对用户日志挖掘以产生个性化信息推荐的系统PIRS。该系统包含6个不同层次具有独立功能而又相互关联的Agent任务模块,引入多个Agent收集和分析用户信息来学习用户的兴趣和行为,体现个性化信息推荐的智能性;利用PIRAgent在用户日志中进行挖掘时,采用的关联规则挖掘方法是基于位对象技术和改进的FP Tree构造方法,提高系统推荐效率。  相似文献   

19.
关联规则兴趣度的度量   总被引:16,自引:2,他引:14  
本文对PS公式(关联规则兴趣度的一种度量公式,简单有效)的数学特性进行了深入的讨论,指出了它的优点和不足,并在此基础之上提出了一个新的度量规则兴趣度的方法.这种度量方法综合考虑了用户主观偏好、规则准确度、规则相关度对规则兴趣度的影响,克服了支持度-可信度框架的缺陷,可以用来简化寻找令人感兴趣规则的过程,优化现有的关联规则挖掘算法,因此,具有很好的应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号