首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
提出了一种利用web搜索引擎如Google自动完成本体映射的方法.该方法通过构造句法模式,利用web搜索引擎获得异构本体概念间的上下义关系,产生由本体概念对组成的初始候选映射集.根据本体的概念层次建立一个产生式规则集,从初始候选映射集中去除不符合本体语义的概念对,同时加入符合本体语义但未被初始候选映射集包含的概念对.最后,按照基于互信息的映射选取规则从候选集映射集中自动产生本体映射.实验结果表明,该方法的F-measure可达到75%~100%,能有效地完成本体之间的映射.  相似文献   

2.
于蕾  王琴  孙沁瑶  马萌 《教育技术导刊》2016,15(10):130-133
将关联规则挖掘算法推广到图像标注领域,提出了适用于图像语义标注任务的加权关联规则挖掘算法。通过为每个标签及标签集合赋予一定权重,可以保留出现次数少却具有重要意义的标签,以更好地挖掘语义标签之间潜在的有价值的规则。对语义概念之间的层次关系进行了研究,利用高层语义概念对图像标签的结果集合进行扩展,以避免人工标注过程中的不完整标注和遗漏标注问题。实验验证表明,该算法在发现关联规则的数量和扩展标签的质量上性能都优于经典的Apriori算法,证明了该算法的有效性。  相似文献   

3.
面向信息处理的“二标三句式”复句层次关系判定   总被引:1,自引:0,他引:1  
复句层次关系识别对计算语言学句法分析和复句信息工程意义重大。为解决关系标记显现不充足给复句层次关系识别所带来的困扰,需要充分挖掘可供计算机理解的复句关联的形式化句法语义知识。本文探讨了分句主语指称一致性和谓语语义相关性对分句语义关联的影响,深入分析了4种联结模式的"二标三句式"复句的句法语义特点,总结提取出11条层次关系判定规则,以期为复句层次关系识别奠定基础。语例验证表明,该研究能有效解决"二标三句式"复句的层次关系判定问题。  相似文献   

4.
项目加权关联规则挖掘中,权值反映了数据的重要程度,权值对项目支持度有加强或减弱作用.通过比较M INWAL(O)、M INWAL(W)等加权关联规则挖掘模型,分析了权值对加权关联规则挖掘产生的影响,并针对M INWAL(W)模型在加权候选频繁项目集剪枝方面存在的不足,利用支持度下界对剪枝策略进行了改进,从而有效地减少挖掘过程的计算量.  相似文献   

5.
通用本体学习框架研究   总被引:3,自引:0,他引:3  
提出了一种通用本体学习框架GOLF,通过对网络上各专业领域web文档集进行挖掘来实现本体自动构建,讨论了本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术,通过实验对算法进行了测试,并对本体评价方法进行了探讨.由于集成了多种机器学习算法,该方法在概念抽取和语义关系学习方面具有更高的准确性.采用通用本体WordNet和HowNet作为语料库,它可适用于不同的专业领域.同时,通过按需获取web文档,该方法能实时生成本体.  相似文献   

6.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

7.
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用.Apriori算法是挖掘关联规则最基本,最核心的算法之一.但Apriori算法只考虑交易中项出现的频率,没有考虑事务集不同项及记录具有不同的重要性,挖掘出来的规则具有一定的局限性.针对这点不足本文提出一种记录加权关联规则挖掘,结合Apriori算法并加以改进,给出相应的New-Aproiri算法.  相似文献   

8.
学习资源是数字化学习生态系统的核心要素,虽然各种媒介形态的资源不断涌现,资源数量持续、快速增长,但是资源之间普遍缺乏关联性.动态建立、发展、挖掘资源之间的各种语义关联,是实现资源关联进化亟需解决的重要问题.该文基于学习元平台(Learning Cell System,LCS),提出一种综合应用语义基因、基于规则的推理、关联规则挖掘等技术实现资源动态语义关联的方法.实验结果表明,该方法在实现资源动态语义关联上能取得理想的结果,具有较高的关联准确性.  相似文献   

9.
为成功实施大规模定制战略,研究解决了在语义层次建模产品配置知识的问题.结合语义web技术,提出了基于本体的配置知识建模方法.开发了通用配置本体为建模特定产品领域的配置知识和规则提供公共的概念结构,采用OWLweb本体语言和语义web规则语言(SWRL)形式化地表示了配置本体、领域配置知识和规则,以促进各种配置知识的一致性、可维护性和重用性.可定制的个人计算机族的配置知识建模说明了该方法能为特定的产品配置领域提供明确的、计算机可理解的知识语义,高效率地支持自动的复杂产品配置任务.  相似文献   

10.
发现关联规则是数据挖掘技术的重要任务之一。之前提出的绝大多数算法需要多次遍历数据库才能产生频繁项集,造成巨大的CPU和内存开销。根据网上交易数据海量的特点,提出了一种基于频繁模式增长(FP-growth)的并行算法。该算法可以在不产生候选集的基础上并行的挖掘海量数据。试验证明该算法可以缓解了项目数量巨大而内存不足的矛盾,减少了算法的执行时间。利用该算法对网上交易进行关联规则挖掘,发现了有价值的决策支持信息。  相似文献   

11.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

12.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

13.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

14.
对Apriori算法在数据库扫描和产生的候选项集的问题进行分析,提出一种基于矩阵的关联规则算法,该算法将事务数据库转换为向量矩阵,并通过向量矩阵的运算得到较少的候选项集,提高算法的运行效率.该算法在高校教学评价的应用上取得良好效果.  相似文献   

15.
提出了一种支持本体构造的语义分析方法,该方法识别和定义概念间的语义联系,并将概念间的语义联系映射或转换成OWL原语.首先讨论了3种最常见的抽象(即包含、聚集和联系)以及它们在本体中含义,然后分析并用实例演示了3种抽象的OWL实现方法.当所有的语义联系都被识别和描述后,就产生了OWL本体的主干部分(即分类、对属性的约束、以及分类间的关系).该研究是发展本体概念模型(OCM)以及实现模型间映射或转换的基础.  相似文献   

16.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

17.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

18.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

19.
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效.  相似文献   

20.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号