首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
关联数据的自动关联构建研究*   总被引:4,自引:0,他引:4  
介绍三种自动关联构建的方法——基于实体的文本映射、基于图相似度的映射和基于规则的关联构建。基于实体的文本映射是实现自动关联的基本方法,图映射是对单一三元组比较方法的扩展,这两种方法都具有很强的通用性,但创建的关系类型却非常有限。而基于规则的关联构建能够创建较为丰富和复杂的关系,但依赖于特定的数据模型和相关规则。  相似文献   

2.
基于本体构建的协同推荐研究   总被引:2,自引:0,他引:2  
通过构建领域本体,利用用户兴趣与领域本体中概念的映射关系,构建用户兴趣本体,发掘用户兴趣模式。研究用户兴趣本体相似度的计算方法,并通过用户兴趣相似度进行垂直加权,通过时间新颖度进行水平加权,从而利用改进的加权关联规则挖掘算法对用户感兴趣的领域本体中的概念进行挖掘,实现面向内容的协同推荐。  相似文献   

3.
针对当前跨媒体检索算法没有充分利用不同媒体特征之间的潜在语义关联和无法解决跨媒体检索过程中的维度灾难与语义鸿沟问题,研究并设计基于语义关联挖掘的跨媒体检索算法。该算法主要由语义关联挖掘、跨媒体本体动态构建、跨媒体语义相似度计算三个部分组成。研究表明,该算法能够有效地提升跨媒体检索的准确率和效率,能够在一定程度上满足用户跨媒体检索的需求。  相似文献   

4.
针对数据挖掘中的关联规则挖掘广度及效率问题,提出了一种基于免疫优化的关联规则挖掘算法.将数据原始记录和候选模式分别作为抗原和识别抗体,通过免疫聚类竞争加速克隆扩增,提高抗体成熟力及亲和性,增强候选模式支持度.在算法执行过程中,支持度大于阈值的优秀个体都将被作为记忆细胞保存下来.这样,记忆细胞所代表的模式满足最小支持度要求,可以很容易提取出也同时满足最小置信度要求的关联规则.试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,提高了所得关联规则的准确率.在高校教学质量评估及规则挖掘中体现出应用价值.  相似文献   

5.
关联数据研究由关联发布逐渐走向集成应用,为此需要解决RDF链接的关联问题分析支持向量机方法、后向关联方法、模式映射方法和R2R属性转换方法等RDF关联原理,在此基础上从系统框架、支撑语言和关键算法的视角分析Silk、LIMFS和R2R三种关联框架最后从算法、框架和应用的角度分析RDF关联研究的未来发展动向  相似文献   

6.
基于语义计算的查询扩展优化研究   总被引:1,自引:0,他引:1  
桑艳艳  刘培刚  李勇 《情报学报》2007,26(5):704-710
查询扩展技术是指在原有查询的基础上加入与用户输入的检索用词相关联的新词,组成新的更长、更准确的查询,用于弥补用户查询信息不足的缺陷.为了提高文本检索的效率,纳入网络检索环境下的用户个人偏好,在查询扩展技术中引入语义计算是一个重要研究方向.文章从语义计算的角度提出了基于语义关联树的查询扩展算法,通过动态生成语义关联树,有效降低词相似度矩阵计算工作量.通过控制语义关联树的层次结构及复杂度,灵活高效的生成不同语义空间模型.实验证明,该算法能有效提高文本检索的准确率.  相似文献   

7.
随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据集间实体识别及链接构建的方法。首先进行数据集间的实体匹配,采用基于K中心点聚类算法实现属性的聚合及关系发现,对具有高相关度的属性进行匹配关系描述,降低实体匹配时的属性匹配计算次数;其次对已匹配的属性进行实体属性值的相似度比较计算,实现实体间相似度的比较,在SILK框架下实现实体的链接构建工作,以达到实体链接发现的目的;最后通过实验验证,这一方法能降低数据集间实体匹配计算次数,提高实体链接的正确率,具有可行性及实用性。图12。表4。参考文献19。  相似文献   

8.
关联规则兴趣度度量方法的比较研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘中重要的研究课题,已有许多有效的实现算法。然而,这些算法找到的关联规则数目太多,用户无法对其进行分析。为了克服这个问题,出现了一些关联规则衡量标准来分析规则的有趣性,在本文里我们在给出的实例上比较分析了一些关联规则客观兴趣度度量指标,提出了使用关联规则客观兴趣度度量指标的一些建议。  相似文献   

9.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

10.
大多数传统的数据挖掘算法,通常是在二进制值的事务数据库中在单一层次上发现属性之间的关联关系即关联规则,但是大多数的数据库包含有大量量化的值。通常人们采用分区的方法处理量化值,然而这种处理方法带来分区过硬的问题。本文使用模糊的方法从Web日志中发现模糊泛化的Web网页之间的关联规则,它们能够体现出带模糊浏览时间的网页之间的关联关系。通过实例分析表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效的模糊泛化关联规则的提取。  相似文献   

11.
曾文  徐红姣  李颖  王莉军  赵婧 《情报工程》2016,2(3):037-042
文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效的科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法优于传统的TF-IDF计算方法。  相似文献   

12.
多媒体信息检索是根据相似性度量而不是精确匹配技术进行检索的。有效性是测量多媒体检索系统性能的一个主要参数,本文着重介绍了几种常见的有效性度量方法,讨论了各自的优点、缺点和适用性,并给出了一个新的有效性度量方法。  相似文献   

13.
针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系。抽取文本主题句的任务转化为搜索图中边最多的点。利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题。选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性。  相似文献   

14.
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以MeSH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用PubMed中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度的计算,发现干细胞领域2011-2014年较为新颖的主题为未成年人干细胞研究。后续研究中还需融入基于统计的主题相似度,从而更加全面地揭示主题间的关系,发现语义层面领域的新颖性研究主题。  相似文献   

15.
本文重点探讨基于编辑距离的网页相似度算法在Web 抽取系统中的应用与实现.通过结合基于URL 及编辑距离的网页结构相似度的计算方法,抽取系统在抽取过程中能够检测网页结构的变化,从而主动做出判断,选择适应规则进行抽取或通过主动学习自动扩展规则库.结构相似度计算赋予系统感知网页结构变化的能力,系统通过主动自我更新与调整,能更好地适应面向实际应用的异构资源的获取.算法的可行性和效率在原型系统中得以验证.  相似文献   

16.
薛凌 《大观周刊》2012,(27):256-258
如何营造良好的学习氛围一直是广大教育工作者最为关心的问题之一,但目前对如何量化分析学习氛围却没有相应的研究。学习氛围形成过程和传染病传播过程的相似性,阐明了利用传染病模型进行研究的可行性,进而建立了Immunity模型和Spread模型,使用数学软件MATLAB进行了仿真计算,通过仿真结果分析了学习氛围形成过程的变化规律,确定了影响学习氛围的主要因素,并在此基础上提出了营造良好学习氛围的措施,为学习氛围的研究提供了新的方法和途径。  相似文献   

17.
《Communication monographs》2012,79(3):161-183

Perhaps the most well‐known finding in the study of interpersonal relations is that attitude similarity leads to attraction. Recent research has found that the similarity‐attraction effect is diminished after informal social interaction. The mediating effects of verbal and nonverbal behaviors in attenuating or strengthening the effects of similarity on attraction have not themselves been studied. The present experiment tests the similarity‐attraction relationship in a conversational setting while investigating the effects of kinesic and vocal behaviors as mediators. Forty dyads, with similar and different attitudes who were newly acquainted or well known to one another, participated in 30 minute, non‐directed conversations. Their conversations were videotaped and coded for several vocal and kinesic indicators of involvement. After taping, subjects filled out attraction and satisfaction measures. Analyses revealed that attitude similarity affected attraction and satisfaction, even after an intervening interaction. Attitude similarity affected posture and orientation as well as similarity in gaze and adaptors; relationship stage affected vocalizations and discrepancies between partners’ speech rate and posture behaviors. Finally, it was found that senders’ smiling, speech rate, and postural orientation explained variance in partner attraction and satisfaction beyond that due to initial attitude similarity‐dissimilarity; certain measures of behavioral similarity accounted for attraction and satisfaction outcomes, reducing the effects of attitude similarity.  相似文献   

18.
Computational modelling of music similarity is an increasingly important part of personalisation and optimisation in music information retrieval and research in music perception and cognition. The use of relative similarity ratings is a new and promising approach to modelling similarity that avoids well known problems with absolute ratings. In this article, we use relative ratings from the MagnaTagATune dataset with new and existing variants of state-of-the-art algorithms and provide the first comprehensive and rigorous evaluation of this approach. We compare metric learning based on support vector machines (SVMs) and metric-learning-to-rank (MLR), including a diagonal and a novel weighted variant, and relative distance learning with neural networks (RDNN). We further evaluate the effectiveness of different high and low level audio features and genre data, as well as dimensionality reduction methods, weighting of similarity ratings, and different sampling methods. Our results show that music similarity measures learnt on relative ratings can be significantly better than a standard Euclidian metric, depending on the choice of learning algorithm, feature sets and application scenario. MLR and SVM outperform DMLR and RDNN, while MLR with weighted ratings leads to no further performance gain. Timbral and music-structural features are most effective, and all features jointly are significantly better than any other combination of feature sets. Sharing audio clips (but not the similarity ratings) between test and training sets improves performance, in particular for the SVM-based methods, which is useful for some applications scenarios. A testing framework has been implemented in Matlab and made publicly available http://mi.soi.city.ac.uk/datasets/ir2012framework so that these results are reproducible.  相似文献   

19.
Content-based image retrieval (CBIR) algorithms have been seen as a promising access method for digital photograph collections. Unfortunately, we have very little evidence of the usefulness of these algorithms in real user needs and contexts. In this paper, we introduce a test collection for the evaluation of CBIR algorithms. In the test collection, the performance testing is based on photograph similarity perceived by end-users in the context of realistic illustration tasks and environment. The building process and the characteristics of the resulting test collection are outlined, including a typology of similarity criteria expressed by the subjects judging the similarity of photographs. A small-scale study on the consistency of similarity assessments is presented. A case evaluation of two CBIR algorithms is reported. The results show clear correlation between the subjects' similarity assessments and the functioning of feature parameters of the tested algorithms.  相似文献   

20.
在分析标签共现的基础上, 提出一种基于共现的标签谱聚类方法, 该方法直接利用标签的共现关系来测度标签的相关性, 能够避免将标签表示成向量空间模型时所带来的高维稀疏等问题.在衡量标签的共现相似性时, 设计一种综合的方法, 并给出标签综合共现相似度的计算公式.与传统的单一利用标签的个体共现来衡量其相似性相比, 综合的方法同时考虑标签的个体共现相似性和标签的群体共现相似性, 能够更加精确地刻画标签的共现相似度.实验结果表明, 基于综合共现相似度的标签共现谱聚类方法具有较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号