首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
同义关系是构建知识组织系统的重要方面。从词汇语义学角度对术语同义关系类型加以界定,采用词形还原工具Norm获得英文术语原形,获得同义词候选集,进而基于词形模糊归并模型确定同义关系。实验结果表明,基于词形的模糊归并有助于提高术语同义关系的构建效率。  相似文献   

2.
以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(Web Synonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。  相似文献   

3.
总结缩略语的3个特点,即全称多样性、来源多样性、形式多样性,并对《英文超级科技词表》中同义术语归并时缩略语的处理方法进行研究,归纳出直接同全称对应归并处理、添加全称限制、添加范畴限制、基于词频大小选择性归并等4种处理方法;讨论叙词表中缩略语作为优选词和非优选词的原则、缩略语对检全率和检准率的影响以及缩略语范畴号重复性等问题。  相似文献   

4.
面向数字图书馆的本体自动构建   总被引:1,自引:0,他引:1  
提出一种面向数字图书馆的本体自动构建方法:首先从因特网数据中找出本体语义概念的模式及其关系,然后通过构建概念分类体系来自动化地抽取数字图书馆的各类本体。包括以下步骤:术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。图3。参考文献3。  相似文献   

5.
如何从语言学而非翻译学的角度去分析英汉对应语的语义不对等现象,学界研究不多。本研究以对比语言学研究的核心,即语言的共性和个性关系作为理论前提,通过比较英汉对应语之间的关系,构建英汉对应语"对称"模式,引入英汉对应语"不对称"概念。然后,用语义参数"X"表示英汉对应语的语义共核,以英汉动植物对应词语为例,对对应语不对称现象进行词汇语义学阐释和分类。  相似文献   

6.
自动术语识别存在的问题及发展趋势综述   总被引:2,自引:0,他引:2  
自动术语识别对于以内容分析为主的情报研究具有重要作用。在目前研究的基础上,重点分析自动术语识别存在的问题,包括词性过滤难以兼顾召回率和准确率、单词术语和低频术语的识别未引起足够重视、术语识别领域相关性有待加强等。最后阐述自动术语识别的多特征融合、机器学习方法、高质量和高隶属度的领域术语识别、新术语识别、语义识别等发展趋势。  相似文献   

7.
基于概念空间方法的信息检索技术研究   总被引:14,自引:0,他引:14  
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。  相似文献   

8.
UMLS多词表整合机制研究   总被引:1,自引:0,他引:1  
文章基于对UMLS超级叙词表、语义网、专家辞典的分析,及对UMLS系统结构和数据的解析,重最探讨UMLS多来源词表同义概念的归并机制、异构异质词表术语、关系、属性信息的集成方法,以及范畴体系的构建理念,最后就UMLS多词表整合策略进行讨论。  相似文献   

9.
针对海量英文文献信息自动化处理问题,构建了一个基于英文超级科技词表的文献主题概念自动标引系统,采用词典与规则方法相结合的术语提取机制,实现了英文文献术语提取、规范概念映射以及优选概念标引等功能,取得了较好的标引效果。  相似文献   

10.
[目的/意义]为ISO术语国际标准实现语义Web化服务提供可行的方案和系统验证。[方法/过程]针对ISO 5127(Information and Documentation-Foundation and Vocabulary)的整体信息和第3部分的术语款目结构特征,提出了相应的SKOS语义描述方案。利用计算机程序自动判断其Word格式或HTML格式文本中每一个术语的唯一代码、首选标签、替代标签、定义、来源、示例等,将所有术语款目转换为相应的SKOS文件,并采用分类法共享服务系统CLSS的解决方案,实现了ISO 5127的共享服务系统ISO 5127_CLSS,包含Web版、Linked Data服务和Web Service服务功能。[结果/结论]采用Dublin Core和SKOS对ISO 5127术语国际标准进行语义描述,并采用CNKOS的支持系统CLSS解决方案快速实现其广泛共享服务是切实可行的。其他分类法类型的知识组织系统(如分类法、范畴表、规范代码表等)均可依此方法快速完成语义描述方案的设计和共享系统的实现。  相似文献   

11.
俞琰  赵乃瑄 《图书情报工作》2018,62(21):118-126
[目的/意义]针对专利主题分析中以词为基本单位会造成专利中的多词术语难以被识别、主题模型结果不佳的问题,提出融入术语的专利主题发现模型,以解决该问题。[方法/过程]模型首先引入类别熵,有效地识别出专利文献中的术语;然后利用泛化波利亚瓮模型增加语义相似术语分配到同一主题的概率,以缓解术语作为基本主题模型分析单位所带来的数据稀疏性问题。[结果/结论]实验结果表明本文提出的模型包含的术语信息提高了主题生成的质量,使主题表示具有更强的可读性和主题判别性。  相似文献   

12.
在对科技政策领域术语的特点分析基础上,提出一种适用于科技政策领域的术语识别方法,即结合科技政 策术语的语言特点,采用统计计算的方法进行两次术语过滤过程,实现科技政策术语的自动识别。实验结果表明,本 文提出的基于科技政策术语语言特点和统计计算相结合的科技政策术语自动识别的方法具有一定的可行性,将用于科 技政策词典的构建和科技政策文本内容的深层次语义分析。  相似文献   

13.
[目的/意义] 从术语释义角度出发,探讨叙词表编制过程中词间关系的构建方法。[方法/过程] 叙词表的词间关系主要有等同关系、等级关系和相关关系三种。从术语释义角度出发,对术语释义模式进行分析,并提出基于术语释义分析获取等同关系、等级关系和相关关系的方法。最后,从术语的多义性和释义的可变性对该方法进行讨论。[结果/结论] 通过术语释义获取词间关系,能够使词间关系更符合逻辑,有利于叙词表进行语义控制。  相似文献   

14.
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。  相似文献   

15.
李纲  叶光辉 《图书情报工作》2013,57(21):104-111
语义网的发展为模糊语词转模糊概念检索提供了可能,鉴于词表在模糊检索系统中的主导地位,实现模糊概念检索必须先完成词表向本体的转换。在综合分析和评价已有转换方法的基础之上,提出综合转换法。该方法继承间接转换法规范的概念抽取及关联设计规则,又通过综合评议和词信息量、词间关联度、文档频率等参数的算法设计改变了直接转换法过于程式化的处理方式。最终将词词关联矩阵转换为概念矩阵,叙词表升级为本体库,并在现有检索算法的基础上设置了检索原子与概念的映射关系,以实现概念检索。  相似文献   

16.
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。  相似文献   

17.
Exploiting the Similarity of Non-Matching Terms at Retrieval Time   总被引:2,自引:0,他引:2  
In classic Information Retrieval systems a relevant document will not be retrieved in response to a query if the document and query representations do not share at least one term. This problem, known as term mismatch, has been recognised for a long time by the Information Retrieval community and a number of possible solutions have been proposed. Here I present a preliminary investigation into a new class of retrieval models that attempt to solve the term mismatch problem by exploiting complete or partial knowledge of term similarity in the term space. The use of term similarity enables to enhance classic retrieval models by taking into account non-matching terms. The theoretical advantages and drawbacks of these models are presented and compared with other models tackling the same problem. A preliminary experimental investigation into the performance gain achieved by exploiting term similarity with the proposed models is presented and discussed.  相似文献   

18.
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。  相似文献   

19.
[目的/意义]基于成果特征标识学者的学术专长是学者画像的重要任务,对学者分类、评审专家遴选、发现小同行等应用具有重要价值。[方法/过程]首先分析揭示学术专长的因素,用层次分析法构造专长标签权重分配模型;采用TextRank和概念链接技术从中英文成果内容中识别主题术语,结合权重筛选出具有领域共识和专长概括性的词汇作为专长标签。选取获得人才称号的多个领域科研人员,从中文或英文代表成果中提取专长标签,以人才公示中的专长领域作为对照基准,通过人工打分和语义计算评测识别效果。[结果/结论]在被贴中文专长标签的学者中,71.9%的个体的专长描述被认为满意。在被贴英文专长标签的学者中,77.2%的个体的专长描述被认为满意。实验表明提出的学者学术专长识别方法具有合理性。主要创新在于:在中英文不同语种以及是否存在外部知识库的条件下,提出从文献内容中挖掘候选标签词的解决方案;结合计量因素,用多种成果特征筛选专长标签,并提出权重分配的方案;针对评价基准欠缺的问题,提出基于语义计算的方式补充答案,从而扩充评价手段。  相似文献   

20.
本体表示语言转换技术研究综述   总被引:1,自引:0,他引:1  
在介绍本体表示语言发展概况的基础上,从主要元素和推理机制对8种常用本体表示语言进行分析研究。探讨本体表示语言的语法和语义问题,指出本体表示语言的转换技术是本体整合、共享和应用的前提。将本体表示语言转换分为语法转换和语义转换两个部分,介绍和比较现有本体表示语言转换模型和转换工具。最后,讨论存在的问题和未来的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号