首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
面向查询扩展的特征词频繁项集挖掘算法   总被引:1,自引:0,他引:1  
为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。  相似文献   

2.
提出一种新的基于负关联规则与频繁项集挖掘的信息检索系统模型,详细阐述系统模型的设计思想、各模块的功能,以及检索系统实现的三种关键技术(即频繁项集挖掘技术、负关联规则挖掘技术和查询优化扩充技术)及其检索算法。实验结果表明,该检索系统能有效提高和改善信息检索性能。  相似文献   

3.
挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性.  相似文献   

4.
本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性.  相似文献   

5.
介绍一种Apriori的改进算法,该算法通过寻找大于最小支持计数的最大频繁项集,可以直接得到最终频繁项集,将改进算法应用到图书馆书目推荐服务中,并对改进算法与Apriori算法进行算法的性能分析及实验数据的运行时间对比,实验证明改进算法在运行速度和挖掘性能上较经典Apriori算法有显著提高。  相似文献   

6.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。  相似文献   

7.
[目的/意义] 将闭频繁项集挖掘技术应用于专利文本,进而分析技术的演化发展趋势,从微观层次描绘既定领域中主要的技术发展脉络。[方法/过程] 在进行闭频繁项集挖掘过程中,以专利文本的术语为事务、术语中的单词作为项,继而使用闭频繁项集之间的关联规则建立起术语层次网络,最后以术语层次网络为依托创建技术路线图。[结果/结论] 实证结果表明,该方法应用于硬盘驱动器磁头领域,能够刻画出不同术语的融合、派生过程,从而描绘出更加符合技术演化真实情况的技术路线图。  相似文献   

8.
黄月红  周秀梅  覃泽 《图书馆界》2010,(4):30-32,69
本文将关联规则应用于图书借阅的服务推荐方法,首先对读者借阅历史记录进行预处理,然后进行关联规则挖掘和分析,利用挖掘出的频繁项集进行服务推荐。该方法与传统推荐技术相比,能更全面、准确、清晰地进行图书借阅推荐。  相似文献   

9.
已有的频繁模式挖掘算法难以适应像生物信息数据挖掘、图模式挖掘等频繁巨模式挖掘应用.提出一种频繁巨模式挖掘算法,即基于核模式合成的频繁巨模式挖掘算法(Core Pattern Fusion Based Colossal Frequent Pattern Mining Algorithm,CPFCFPA),通过将各较小的核模式进行一步合成,寻求一个对频繁巨模式完整集的蕴含集.引入项集编辑距离概念,提出一种新颖的评价频繁巨模式挖掘结果质量的评测模型.实时数据集实验显示,CPFCFPA具有较好的可扩展性和挖掘性能,且对当前频繁模式挖掘算法难以或不能实现的挖掘任务,其挖掘结果能做到对频繁巨模式完整挖掘集的较好近似.  相似文献   

10.
陶俊 《图书情报工作》2018,62(21):140-148
[目的/意义]词表语义组织是馆藏语义化研究的重要组成部分,梳理该领域的历史演进有利于明晰重点并推动其更好发展。[方法/过程]在辨析词表语义组织领域核心术语的基础上,提出"标准规范——语义组织方法——支撑技术——词表应用"研究框架,基于该框架梳理中文叙词表语义研究代表文献。[结果/结论]提出词表语义组织的定义及其主体框架,揭示了词表、本体、关联数据等的核心概念及其有机联系;以叙词表为例梳理我国词表语义组织研究近10年来的代表性研究工作;比较词表传统研究与语义组织研究的内在异同,并对我国词表语义组织研究进行述评和展望。  相似文献   

11.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

12.
针对当前跨媒体检索算法没有充分利用不同媒体特征之间的潜在语义关联和无法解决跨媒体检索过程中的维度灾难与语义鸿沟问题,研究并设计基于语义关联挖掘的跨媒体检索算法。该算法主要由语义关联挖掘、跨媒体本体动态构建、跨媒体语义相似度计算三个部分组成。研究表明,该算法能够有效地提升跨媒体检索的准确率和效率,能够在一定程度上满足用户跨媒体检索的需求。  相似文献   

13.
数据挖掘中分类方法综述   总被引:3,自引:0,他引:3  
数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类 算法大体可分为传统分类算法和基于软计算的分类法两类,主要包括相似函数、关联规 则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传 算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围,研究者对 已有算法的改进有所了解,以便在应用中选择相应的分类算法。  相似文献   

14.
针对现有并行挖掘技术需要建立在专门的并行机上而使中小图书馆难以实现的弊端,通过研究关联规则的内在并行性,提出一种基于图形处理单元技术的快速并行关联规则算法,实现在单处理器上并行数据挖掘。通过仿真实验证明,优化后的算法在不增加硬件设备的前提下实现单处理机并行,提高运行速度,解决传统并行关联规则挖掘难以应用化的问题,该算法对于数字图书馆具有重要的理论和应用价值。  相似文献   

15.
本文采用人工免疫算法进行关联规则挖掘,通过权值设置发现在事务数据集中有意义的二进制关系,将挖掘工作集中在那些有着特殊权值的有意义的关联项,避免了挖掘工作在大量的无意义的关系项中搜索.实验证明,此算法是有效的且灵活性强,能在Web使用数据集中发现有意义的带权值的关联规则.同时给出了在最小支持度和最小置信度不变的情况下,在动态数据集中进行增量关联规则挖掘的方法.同样使用权值方法来提升新数据集的重要性.此方法的可行性和有效性同样在实验中体现出来.  相似文献   

16.
面对网络中日益丰富的文本性情感信息资源,利用关联挖掘技术对其进行智能化的自动挖掘与分析,获取语义层面的用户情感知识,对于企业竞争策略的制定和竞争优势的保持具有重要的潜在价值。将关联挖掘技术融入文本情感分析之中,研究并设计一种融合语义关联挖掘的文本情感分析算法,实现语义层面的情感分析与用户情感知识挖掘。实验结果表明,该算法取得了很好的预期效果,显著提高了情感分析的准确率与效率以及关联挖掘的深度与广度。  相似文献   

17.
基于XML和关联规则的Web挖掘研究*   总被引:4,自引:1,他引:4  
首先对Web挖掘、关联规则分析及XML作了简要介绍,提出了基于XML和关联规则的Web挖掘研究思想,随后对XML结构挖掘、XML内容挖掘和基于XML的Web日志挖掘进行讨论,建立了一个较为完整的XML挖掘体系。  相似文献   

18.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

19.
一种基于数据挖掘技术的馆藏资源个性化推荐服务   总被引:2,自引:0,他引:2  
本文介绍了一种如何将ID3决策树算法和关联规则应用于馆藏文献信息资源的个性化推荐服务当中去的方法.文中首先对读者借阅历史记录进行了挖掘和分析,利用决策树算法挖掘出可推荐的相关读者对象,再依据关联规则提取借阅历史记录并对其进行分析和挖掘,从中找出相关潜在的有用或有价值的规则,然后依据这些规则选择出最适合推荐的项目推荐给读者.该方式是为实现个性化推荐服务所进行的一种新的探讨,具有算法收敛性好,计算方法简单有效,可靠性高,推荐效果显著等优势,与传统推荐技术相比,能够更加全面、准确、清晰地进行文献推荐.理论和实践结果表明,所提出的这种方法是一种行之有效的形式.  相似文献   

20.
分析多媒体数据挖掘的需求,介绍常见的多媒体数据挖掘形式及存在问题,针对此类问题探讨基于网格环境下多媒体关联规则数据挖掘方法,该方法是Apriori算法在网格环境下的具体应用。通过实例证明该方法不仅具有经典Apriori算法的准确性,还具备网格的并行挖掘特性,可大大提高数据挖掘的速度及运算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号