共查询到20条相似文献,搜索用时 156 毫秒
1.
面向查询扩展的特征词频繁项集挖掘算法 总被引:1,自引:0,他引:1
为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。 相似文献
2.
提出一种新的基于负关联规则与频繁项集挖掘的信息检索系统模型,详细阐述系统模型的设计思想、各模块的功能,以及检索系统实现的三种关键技术(即频繁项集挖掘技术、负关联规则挖掘技术和查询优化扩充技术)及其检索算法。实验结果表明,该检索系统能有效提高和改善信息检索性能。 相似文献
3.
挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性. 相似文献
4.
本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性. 相似文献
5.
介绍一种Apriori的改进算法,该算法通过寻找大于最小支持计数的最大频繁项集,可以直接得到最终频繁项集,将改进算法应用到图书馆书目推荐服务中,并对改进算法与Apriori算法进行算法的性能分析及实验数据的运行时间对比,实验证明改进算法在运行速度和挖掘性能上较经典Apriori算法有显著提高。 相似文献
6.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。 相似文献
7.
8.
9.
已有的频繁模式挖掘算法难以适应像生物信息数据挖掘、图模式挖掘等频繁巨模式挖掘应用.提出一种频繁巨模式挖掘算法,即基于核模式合成的频繁巨模式挖掘算法(Core Pattern Fusion Based Colossal Frequent Pattern Mining Algorithm,CPFCFPA),通过将各较小的核模式进行一步合成,寻求一个对频繁巨模式完整集的蕴含集.引入项集编辑距离概念,提出一种新颖的评价频繁巨模式挖掘结果质量的评测模型.实时数据集实验显示,CPFCFPA具有较好的可扩展性和挖掘性能,且对当前频繁模式挖掘算法难以或不能实现的挖掘任务,其挖掘结果能做到对频繁巨模式完整挖掘集的较好近似. 相似文献
10.
[目的/意义]词表语义组织是馆藏语义化研究的重要组成部分,梳理该领域的历史演进有利于明晰重点并推动其更好发展。[方法/过程]在辨析词表语义组织领域核心术语的基础上,提出"标准规范——语义组织方法——支撑技术——词表应用"研究框架,基于该框架梳理中文叙词表语义研究代表文献。[结果/结论]提出词表语义组织的定义及其主体框架,揭示了词表、本体、关联数据等的核心概念及其有机联系;以叙词表为例梳理我国词表语义组织研究近10年来的代表性研究工作;比较词表传统研究与语义组织研究的内在异同,并对我国词表语义组织研究进行述评和展望。 相似文献
11.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性. 相似文献
12.
针对当前跨媒体检索算法没有充分利用不同媒体特征之间的潜在语义关联和无法解决跨媒体检索过程中的维度灾难与语义鸿沟问题,研究并设计基于语义关联挖掘的跨媒体检索算法。该算法主要由语义关联挖掘、跨媒体本体动态构建、跨媒体语义相似度计算三个部分组成。研究表明,该算法能够有效地提升跨媒体检索的准确率和效率,能够在一定程度上满足用户跨媒体检索的需求。 相似文献
13.
数据挖掘中分类方法综述 总被引:3,自引:0,他引:3
数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类
算法大体可分为传统分类算法和基于软计算的分类法两类,主要包括相似函数、关联规
则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传
算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围,研究者对
已有算法的改进有所了解,以便在应用中选择相应的分类算法。 相似文献
14.
15.
16.
面对网络中日益丰富的文本性情感信息资源,利用关联挖掘技术对其进行智能化的自动挖掘与分析,获取语义层面的用户情感知识,对于企业竞争策略的制定和竞争优势的保持具有重要的潜在价值。将关联挖掘技术融入文本情感分析之中,研究并设计一种融合语义关联挖掘的文本情感分析算法,实现语义层面的情感分析与用户情感知识挖掘。实验结果表明,该算法取得了很好的预期效果,显著提高了情感分析的准确率与效率以及关联挖掘的深度与广度。 相似文献
17.
基于XML和关联规则的Web挖掘研究* 总被引:4,自引:1,他引:4
首先对Web挖掘、关联规则分析及XML作了简要介绍,提出了基于XML和关联规则的Web挖掘研究思想,随后对XML结构挖掘、XML内容挖掘和基于XML的Web日志挖掘进行讨论,建立了一个较为完整的XML挖掘体系。 相似文献
18.
19.
一种基于数据挖掘技术的馆藏资源个性化推荐服务 总被引:2,自引:0,他引:2
本文介绍了一种如何将ID3决策树算法和关联规则应用于馆藏文献信息资源的个性化推荐服务当中去的方法.文中首先对读者借阅历史记录进行了挖掘和分析,利用决策树算法挖掘出可推荐的相关读者对象,再依据关联规则提取借阅历史记录并对其进行分析和挖掘,从中找出相关潜在的有用或有价值的规则,然后依据这些规则选择出最适合推荐的项目推荐给读者.该方式是为实现个性化推荐服务所进行的一种新的探讨,具有算法收敛性好,计算方法简单有效,可靠性高,推荐效果显著等优势,与传统推荐技术相比,能够更加全面、准确、清晰地进行文献推荐.理论和实践结果表明,所提出的这种方法是一种行之有效的形式. 相似文献
20.
分析多媒体数据挖掘的需求,介绍常见的多媒体数据挖掘形式及存在问题,针对此类问题探讨基于网格环境下多媒体关联规则数据挖掘方法,该方法是Apriori算法在网格环境下的具体应用。通过实例证明该方法不仅具有经典Apriori算法的准确性,还具备网格的并行挖掘特性,可大大提高数据挖掘的速度及运算效率。 相似文献