首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 187 毫秒
1.
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以MeSH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用PubMed中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度的计算,发现干细胞领域2011-2014年较为新颖的主题为未成年人干细胞研究。后续研究中还需融入基于统计的主题相似度,从而更加全面地揭示主题间的关系,发现语义层面领域的新颖性研究主题。  相似文献   

2.
在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。  相似文献   

3.
基于本体的语义相似度计算方法研究综述*   总被引:5,自引:0,他引:5  
在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算等算法模型,最后从宏观层面指出今后本领域的研究方向。  相似文献   

4.
FCA中的概念语义相似度计算   总被引:2,自引:0,他引:2  
形式概念分析和领域本体是两种形式化方法,其目标都是构建概念的模型。提出一种计算FCA中的概念语义相似度的方法,实验结果表明,该方法对概念语义相似度计算是有效的。  相似文献   

5.
基于多层特征的字符串相似度计算模型   总被引:18,自引:6,他引:12  
章成志 《情报学报》2005,24(6):696-701
针对计算字符串相似度传统方法的不足之处,提出以相似元作为字符串的基本处理单元,综合考虑相似元的字面、语义及统计关联等多层特征的字符串相似度计算方法。对常规计算方法中存在的,由相似元排序引起的相似元位置信息丢失问题进行了修正。实验结果表明该算法的有效性,并且对句子间、段落间的相似度计算有启发意义。  相似文献   

6.
基于本体的语义检索技术研究与实现   总被引:3,自引:0,他引:3  
在本体基础上通过语义相似度和相关度的计算,利用语义推理将描述的隐含语义显式化,以充分挖掘出与检索内容相关的信息,实现相关信息的语义融合,提高查准率和查全率。研究基于本体的语义相似度和相关度的计算方法,并通过该语义检索方法的实现,证明该方法在语义检索系统开发中的可行性。  相似文献   

7.
结合语义相似度与相关度的概念扩展   总被引:6,自引:0,他引:6  
聂卉  龙朝晖 《情报学报》2007,26(5):728-732
本文研究在本体构建的语义网环境下,量化领域概念的关联程度扩展概念,实现概念检索的问题.利用语义的层次结构和蕴涵关联计算语义相似度和相关度,并结合二者,提出语义扩展度的概念及计算方法,由此控制调整扩展概念集的范围和大小.经过实例计算与分析,验证并阐明了该方法的合理性、有效性及其特点.  相似文献   

8.
生物医学文献的数量正在以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.挖掘UMLS语义资源进行计算逐渐成为基于文献的知识发现的热点.Miyanishi等通过概念的语义相似度计算事件相似度取得了比统计方法如tf*idf更好的结果.本文在概念的语义相似度的基础上,加入了概念的语义关联度,避免了事件之间语义相似度高而缺乏语义关联度并导致发现的假设不合理的弊端.本文的方法充分挖掘了UMLS中的语义资源,合理地计算了事件之间的相似度.通过雷诺氏病和鱼油以及偏头痛和镁的实验证明,这种计算方法取得较好的效果.  相似文献   

9.
通过对馆藏资源本体相关定义和特点进行分析,在传统语义相似度计算方法的基础之上,提出了一种综合的基于馆藏资源本体模型的语义相似度算法。并构建了竞争情报资源本体,对该算法进行了实例分析。该算法为馆藏资源本体的语义相似度计算提供了一种有效的量化途径。  相似文献   

10.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。  相似文献   

11.
提出一种改进的基于相似度计算的科技文献关键词选取算法。先利用N-gram算法提取领域词库,再综合利用领域词库和常识词库,对最初选择的关键词重新切分,进行给定关键词之间的语义对比。语义相似度大于一定阈值的关键词被认为是表达同一意义的同义词,将同义词在文献库中合并,从而解决关键词冗余问题。实验结果可以证明该方法的有效性。  相似文献   

12.
提出一种结合语义检索和多属性决策方法的商品信息检索模型。通过构建语义向量空间进行语义相似度计算,以实现检索结果与顾客查询关键词的语义匹配;同时该模型也采用TOPSIS多属性决策方法对检索到的商品进行效用值计算,从而建立商品内容的比较机制。最后,从准确率、顾客接受度等指标通过实验证实该模型的有效性,能够提高商品信息检索的精准度。  相似文献   

13.
基于领域本体的语义知识检索研究   总被引:1,自引:0,他引:1  
针对传统知识检索效率低、精度不高等问题,引入本体技术,构建基于领域本体的语义知识检索系统架构,提出综合语义相似度的知识检索算法。算法综合考虑概念间的关系类型、概念所处的层次深度、概念密度、概念间连接的强度以及概念的属性等因素计算语义相似度,避免传统检索中存在的检索精度不高等问题。该模型为构建语义知识检索系统以及解决系统构建中的关键问题提供了理论指导。  相似文献   

14.
基于叙词表的概念语义相似度计算   总被引:3,自引:1,他引:2  
语义相似度计算是信息处理技术中的一个关键问题。提出基于叙词表、基于距离的概念语义相似度计算方法,详细叙述其计算流程。在此基础上,利用《农业叙词表》中的实际数据展开分析验证,从计算结果上看该方法基本可行,从实用的角度出发,可为叙词表的应用作一些尝试和探索。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号