首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 876 毫秒
1.
种子概念方法及其在基于文本的本体学习中的应用   总被引:4,自引:0,他引:4  
介绍基于文本的本体学习及其层次,分析本体学习中术语获取的主要方法。针对术语获取中存在的问题,在术语形成的经济规律基础上,引入种子概念方法,并利用统计和规则两种方法抽取与种子概念相关的领域术语;证明种子概念方法是一种有效获取领域术语的方法。实验证明少量种子词可以获取大量领域术语,为本体构建提供基础和框架。  相似文献   

2.
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域形式化背景的建立、基于形式概念分析的主题概念的生成、基于主题概念格的术语层次关系抽取、术语层次体系的OWL描述和图形展示等.笔者以“白血病”领域为例,详细论证了无知识库支持环境下中文文本到医学学科术语层次结构的衍化过程,并对以文档术语矩阵(DTM)和词汇术语矩阵(WTM)为形式化背景生成的术语层次体系进行了比较分析.  相似文献   

3.
[目的/意义] 从术语释义角度出发,探讨叙词表编制过程中词间关系的构建方法。[方法/过程] 叙词表的词间关系主要有等同关系、等级关系和相关关系三种。从术语释义角度出发,对术语释义模式进行分析,并提出基于术语释义分析获取等同关系、等级关系和相关关系的方法。最后,从术语的多义性和释义的可变性对该方法进行讨论。[结果/结论] 通过术语释义获取词间关系,能够使词间关系更符合逻辑,有利于叙词表进行语义控制。  相似文献   

4.
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。  相似文献   

5.
专利技术术语的抽取方法   总被引:2,自引:0,他引:2  
针对专利中缺少技术关键词的问题,在对主要的术语抽取方法研究的基础上,引入C-value方法,修改了术语构词规则和术语度(termhood)计算公式,用PC-value值测量一个词语的术语度,提出了专利技术术语抽取的流程模型,实现了从专利中抽取技术术语.该模型分为四个阶段:①分词和词性标注; ②运用语言学规则取得可能术语列表; ③计算词语的术语度值,取得候选术语列表; ④领域专家评估并确定术语.实验结果证明,提出的方法能很好地抽取中文专利技术术语,在长术语的抽取和抽取精度上比C-value方法更具有优势.  相似文献   

6.
自动术语识别存在的问题及发展趋势综述   总被引:2,自引:0,他引:2  
自动术语识别对于以内容分析为主的情报研究具有重要作用。在目前研究的基础上,重点分析自动术语识别存在的问题,包括词性过滤难以兼顾召回率和准确率、单词术语和低频术语的识别未引起足够重视、术语识别领域相关性有待加强等。最后阐述自动术语识别的多特征融合、机器学习方法、高质量和高隶属度的领域术语识别、新术语识别、语义识别等发展趋势。  相似文献   

7.
指出术语集成是一项以计算机为交流媒介、对各种知识组织体系的术语资源进行语义映射融合和集中控制管理的应用研究。通过对国内外术语集成与服务的相关研究现状的调研分析,提出基于知识元和MARTIF的术语集成方法,包括面向规范性和应用性的术语集成基本原则,以词汇属性描述、词间关系组织和相关知识链接为描述结构的术语集成描述框架以及应用于数据交换过程中的机器可读术语交换格式(MARTIF)。  相似文献   

8.
在对科技政策领域术语的特点分析基础上,提出一种适用于科技政策领域的术语识别方法,即结合科技政 策术语的语言特点,采用统计计算的方法进行两次术语过滤过程,实现科技政策术语的自动识别。实验结果表明,本 文提出的基于科技政策术语语言特点和统计计算相结合的科技政策术语自动识别的方法具有一定的可行性,将用于科 技政策词典的构建和科技政策文本内容的深层次语义分析。  相似文献   

9.
提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。  相似文献   

10.
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量.获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度.本文试图研究一种不依赖于背景语料的术语领域度筛选方法.本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析.实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果.  相似文献   

11.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.  相似文献   

12.
科学数据语义描述研究述评   总被引:1,自引:0,他引:1  
周宇  廖思琴 《图书情报工作》2017,61(12):136-144
[目的/意义] 对国内外科学数据语义描述相关研究成果进行调研分析,归纳研究热点、研究特征和研究框架,总结研究中存在的不足,提出发展建议,为今后国内科学数据组织和服务提供参考和借鉴。[方法/过程] 从多个权威数据库采集国内外2007年1月至2016年12月发表的有关科学数据语义描述的期刊论文和学位论文,采用比较法和归纳法分析并揭示研究热点,并对相关研究成果进行述评。[结果/结论] 研究结果表明:①国内外科学数据语义描述研究很不均衡,主要研究成果集中在自然科学领域;②基于描述深度、加工层次和表现形式的分析维度更方便洞悉各种语义描述方法的本质特征和区别;③当前科学数据语义描述研究还存在不足,需要在描述对象选择、可视化检索、数据集成、知识发现等方面进行深入研究。  相似文献   

13.
基于语义的馆藏信息检索模型研究   总被引:1,自引:0,他引:1  
研究了语义网的概念及其层次模型,提出一种新型的基于语义的图书馆馆藏信息检索模型,给出了系统的架构体系,分析了系统实现的关键技术。该系统以语义网及本体为基础,将传统的基于关键词的检索提高到基于语义检索。  相似文献   

14.
针对Folksonomy存在模糊、同义字现象,在简要介绍Folksonomy相关研究基础上,深入探讨Folksonomy语义挖掘的两种模式——层次分类分析和三部图分析,认为两者的研究对象、表示Folksonomy的方法及研究目的是相同的,区别在于前者是将三元类层次结构所体现的父子关系作为挖掘模糊标签语义的依据,后者是通过构建一个用户-文档矩阵挖掘模糊标签的语义,最后指出研究与某个标签相关联的文档和用户网络可以揭示标签的不同含义。  相似文献   

15.
本体在网络信息检索中的应用   总被引:2,自引:0,他引:2  
对本体的由来概念、作用及本质等进行较全面的探讨,介绍本体的构建方法和几种编辑工具软件。选取德国AIFB研究所著名的Ontobroker项目作为典型的本体系统,从目标和特点、运行机制、作用评价三个方面对其进行深入、细致的研究,在此基础上提出应构建本体库,以支技网络信息的概念检索系统。  相似文献   

16.
[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考.  相似文献   

17.
针对科技文献特征词在语义上的层次特性,提出基于概念泛化的内容过滤推荐算法.采用矢量空间模型作为用户兴趣偏好和科技文献特征的描述模型;在比较科技文献特征与用户兴趣偏好的相似程度时,首先从字符层面比较科技文献特征词与用户兴趣特征词,然后在基于ODP目录结构的用户兴趣偏好概念泛化树上对字符不相同的特征词对进行语义比较,并修正特征词权重,以避免遗漏"字符不同,但语义相似"的关键词对.理论分析和实验结果表明,该算法能够更加全面、准确地推荐科技文献对象.  相似文献   

18.
首先讨论“知识”语义环境的涵义和主要表现,继而对数据、信息、知识和智慧的含义与特质进行比较分析,重点研究四者之间的语义-逻辑关系和源流状态,在此背景上进而探讨知识与其他重要概念即心智因素的语义联系,最后集中研究处于知识语义环境中的主要因素之间的逻辑联系、层次关系以及其理论基础,提出以认知域为横坐标、知识层面为纵坐标,对“数据-信息-知识I(模糊知识)-知识II(明晰知识)-智慧”连续统一体进行语义-逻辑分析的层次模型,并以此层次模型为分析框架,深入探讨在不同逻辑层次上“知识”及知识相关因素的动态运动机制和递进跃升规律,重点包括数据的筛选和聚合、从数据萃取信息、信息内化为知识I、知识I向知识II的转化蜕变和知识向智慧的升华,以从原始与基础概念层面为构建知识创新理论框架打下认知基础。  相似文献   

19.
Taxonomy、Folksonomy和Ontology的分类理论及相互关系   总被引:3,自引:0,他引:3  
Taxonomy(知识分类学)是关于具体或抽象事物的分类组织的学科与方法,Folkson.omy(分众分类)是大众自发的用标签对网络信息分类标识和共享的资源组织方法,Ontology(知识本体)是从语义和知识层次上描述构架信息系统的概念模型.本文归纳整理了这三个与分类相关的概念及其特性,并进一步厘清这些相关概念间的关系,希望研究结果有助于加深对分类相关概念的理解及应用.  相似文献   

20.
依据语义检索的特征和文本概念的挖掘,通过楚辞研究数据库的语义实践,提出一种以本体知识库建设为核心,由本体开发、资源管理、检索服务三层架构组成,融语义词典、知识地图、跨库查询和专题搜索为一体的个性化关联语义检索模型,力图使当前的语义检索研究跳出实验的框架,促进相关领域文献知识的组织开发与检索利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号