首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于本体的语义相关度计算方法以概念在本体中的结构特征,如深度、密度,概念间的语义关系类型、路径等一系列因素为基础来度量概念间的语义相关度,缺乏对传递因素的考虑.本文通过基于本体的通用语义相关度计算方法的影响要素分析、传统方法的特点研究及语义传递规律的介绍,提出一种基于传递的语义相关度计算方法,并利用<知网>与传统方法基于人工判断进行效果比较,验证了新语义相关度计算方法的应用效果.  相似文献   

2.
全文检索中的汉语自动分词及其歧义处理   总被引:3,自引:0,他引:3  
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。  相似文献   

3.
随着计算机科学的发展,自然语言处理技术在计算机信息检索系统中的应用越来越广泛。对自然语言处理的研究已经成为信息处理系统中的一个重要课题。语词切分是汉语自然语言处理的第一个阶段。目前,计算机自动分词系统的精度尚不能满足实际需求。本文针对影响切分精度的根本因素——歧义现象,提出了采用神经网络模式识别来消除歧义的方法,以达到提高切分精度的目的。 文中对歧义字段进行了分类,分析了其表现形式和现有的消歧机制,以及歧义切分与模式识别之间的关系,研究了神经网络模式识别方法与歧义切分问题相适应的特点。遵循模式识别的一般步骤,对歧义字段进行特征提取,然后,选用神经网  相似文献   

4.
结合语义相似度与相关度的概念扩展   总被引:6,自引:0,他引:6  
聂卉  龙朝晖 《情报学报》2007,26(5):728-732
本文研究在本体构建的语义网环境下,量化领域概念的关联程度扩展概念,实现概念检索的问题.利用语义的层次结构和蕴涵关联计算语义相似度和相关度,并结合二者,提出语义扩展度的概念及计算方法,由此控制调整扩展概念集的范围和大小.经过实例计算与分析,验证并阐明了该方法的合理性、有效性及其特点.  相似文献   

5.
基于知网和术语相关度的本体关系抽取研究*   总被引:1,自引:0,他引:1  
 提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确的语义标签。实验结果表明该方法具有较好的实用效果。  相似文献   

6.
基于概念和语义层次的领域本体评价研究   总被引:1,自引:0,他引:1  
领域本体评价是本体论和语义网研究中的重要内容.本文提出了一种基于编辑距离对领域本体中概念之间的相似度进行计算的方法.此外,通过比较给定的领域本体和"黄金标准"之间在概念的实例的安排以及概念本身的等级安排上具有的相似性,可以在语义角度对二者做出相似性判断.本文利用一个已有的军用飞机领域的本体和<中国分类主题词表>进行比较计算.实验结果表明,该方法能较为准确地计算出两个本体的概念集的相似性,也能较好地衡量本体之间的语义关系,从而实现对领域本体的有效评价.  相似文献   

7.
文章提出一种基于语义知识库知网和向量空间模型理论的文档语义模型构建方法,论述知网知识描述方式的特点,提出一种滑动窗口语义消歧算法,利用知网的义原层次体系对文档模型进行语义化处理,根据语境确定语义,将模型特征项转换为关键词的义项,较好地解决了由于自然语言中存在的同义、近义、上下位等语义关系而产生的模型偏差问题.通过计算义项相似度,加权得到文档相似度.实验证明,该方法较好地描述了文档特征,能够达到良好的聚类效果,是切实可行的.  相似文献   

8.
语义相关度算法在主题抽取中的适用性研究   总被引:1,自引:0,他引:1  
语义相关度的计算方法在信息检索、文本挖掘和自然语言处理等方面有着广泛的应用,而其算法种类很多,这些算法针对不同的应用环境具有不同的适用性.本文汇总了多种语义相关度的计算方法,首先全面地概括分析了各类方法的特点,并以应急预案的主题抽取为背景,通过各种语义相关度算法在基于词汇链的主题抽取中的应用,研究了各种算法对主题抽取效果的影响,从而对各种算法在主题抽取中的适用性给出了相应的评价.  相似文献   

9.
一种面向语义的信息检索方法   总被引:1,自引:0,他引:1  
传统的信息检索技术忽视了语义对检索过程的影响,这是造成查准率不高的一个重要原因.论文提出了一种面向语义的信息检索方法,该方法强调使用基于知网的语义处理技术实现对用户查询需求和目标文档的语义标注,使用基于知网的词汇链技术实现对文档特征词汇的过滤.一方面可以实现语义级别的检索匹配,另一方面可以降低大量无关词对检索结果的干扰.论文描述了一个实现该方法的信息检索系统SOIRS,并且利用该系统与传统检索系统做了对比实验.实验结果表明面向语义的信息检索方法在查准率方面要明显优于传统信息检索方法.  相似文献   

10.
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。  相似文献   

11.
针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC (Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构造的分类器在效率和性能上均比传统KNN有较大的提高。  相似文献   

12.
������ʱ����峡�������   总被引:4,自引:0,他引:4  
通过对我国已出版的多部叙词表的调查分析,认为汉语叙词表语义场的构成有其一定的特点和规律,等同义场和相关义场的构造是汉语叙词表编制的薄弱环节。介绍自然语言叙词表的特点及计算机自动构造的三种方法,指出基于文本的叙词表自动构造方法与汉语的词法相结合,将有助于对汉语叙词表等同义场、等级义场和相关义场的构建。  相似文献   

13.
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。  相似文献   

14.
[目的/意义] 当前非遗数字资源共享主要通过构建门户网站和数字资源库实现,不能有效解决资源共享时出现的语义异构和互操作问题,也无法使资源在深层次的语义和概念层面互联。以新的导向合理组织非遗数字资源并采用更为有效的方式进行资源交互与展示,对非遗资源在全人类范围内的共建共享具有重要意义。[方法/过程] 提出基于语义出版技术的非遗数字资源共享方案,构建以“楚剧”为具体应用背景的语义出版实例,验证语义出版技术在非遗数字资源共享中的可行性。[结果/结论] 利用语义出版技术实现非遗数字资源共享,可以将出版单位细化到知识单元,有效建立知识单元之间及与外部数据集间的语义关联,并通过知识单元内容重组实现资源共享。  相似文献   

15.
词汇集聚提供了文本的结构启示,因而在许多自然语言处理中有极为重要的应用。介绍基于知网分析词汇集聚的方法,首先利用语义网络的形式将知网知识表示出来;然后在文本概念间有引导地建立推理路径;最后基于路径搜索形成体现集聚的词汇链。测试表明,基于知网推理形成的词汇链基本符合人的直觉,准确率较高。  相似文献   

16.
词汇链是文本中一系列词汇关联而成的语义链,构造词汇链有助于提高文本的连贯性,把握文本主题。借鉴概念层次网络(HNC)理论对词汇语义进行形式化描述的原理,研究基于语义网络节点遍历计算的词汇链构造方法。首先对汉语文本进行分词处理,从知识库中获得词语的HNC符号,然后对语义符号进行解析,获得词语的语义关联性并构造词汇链;最后,对词汇链进行优选处理,设定阈值获得优选词汇链。实验结果表明,该方法构造的词汇链可接受度较高,对主题标引、自动文摘、文本分类等有重要价值。  相似文献   

17.
[目的/意义] 在语义出版发展的背景下,针对目前学术期刊数字资源聚合中存在的问题,提出实现面向语义出版的学术期刊数字资源聚合的方法,以期解决学术期刊数字资源提供与科研用户信息需求间的矛盾。[方法/过程] 探讨面向语义出版的学术期刊数字资源聚合模型,构建以"冠心病"为具体应用背景的资源聚合实例,验证面向语义出版的数字资源聚合方法在学术期刊数字出版中的可行性。[结果/结论] 以语义出版为导向进行学术期刊数字资源深度聚合,可以实现数字资源知识单元之间及与外部知识组织的语义关联,为科研用户提供更加高效的信息资源服务。  相似文献   

18.
UMLS语义命题是用三元组表示的最小语义化知识单位,其主语和宾语都是UMLS超级叙词表中的概念,谓词是UMLS语义网络中的语义关系。UMLS语义命题的抽取过程涉及浅层句法分析、概念映射、谓词识别与语义命题生成等环节。两种以UMLS语义命题为基础的医学信息资源聚合方法——用知识单元作为资源单位的聚合方法和用文档关联数据作为资源单位的聚合方法,其聚合结果分别是知识网络和文档网络。  相似文献   

19.
知识组织系统中关系模式的应用比较   总被引:2,自引:0,他引:2  
文章以医学数字信息资源知识组织为案例,对领域本体、目前常用的医学数字信息资源知识组织的工具《医学主题词表》和统一医学语言系统的语义网络进行对比研究,深入分析了三者的联系和区别,在此基础上讨论了知识组织体系中的关系模式在知识组织中的应用特点。信息资源知识组织有赖于领域本体的完善,而领域本体高质高效的构建和应用需充分发扬和整合主题词表和语义网络的成果,即利用叙词表已经规范了的专业概念和语义网络定义的语义类型。  相似文献   

20.
通过挖掘网络日志中的查询词语义关系,将《知网》的语义知识加入到聚类算法中实现搜索引擎优化。该方法通过机器学习算法深入挖掘查询日志,对其中的查询串进行概念相似度、语义聚类等计算,使返回网页更加合理,将更准确的网页结果呈现在用户面前,能够更好地满足用户需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号