首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
中文本体的半自动构建研究   总被引:1,自引:0,他引:1  
本体构建是开发基于本体的知识管理系统的基础和根本,目前中文本体库的构建基本上还停留在手工建库阶段,造成本体应用人力成本高,开发周期长的问题.讨论本体的半自动构建可以简化本体库的构建过程,推进本体技术的发展.文章分析了本体构建的软件工程学方法、语义提取方法和素材选择原则,讨论了结构化、半结构化知识源构建本体的方法与思路,并以实倒进一步论证了研究方法和思路的科学性和可行性.  相似文献   

2.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

3.
多媒体元数据的语义集成和检索   总被引:2,自引:0,他引:2  
张海玲 《情报科学》2007,25(7):1052-1057,1098
基于从XML Schema到web本体映射的XML20WL映射和从XML到RDF映射的XML2RDF映射而建立的MPEG-7对OWL完整而自动的映射,把多媒体元数据应用于语义网,从低层描述符提取基于内容的高层描述符,由此产生显性语义元数据及构成多媒体语义元数据集成的基本本体框架的MPEG-7 OWL本体,从而实现对MusicBrainz模式、Simac音乐本体等三种不同音乐模式的多媒体元数据进行语义集成及语义检索。  相似文献   

4.
【目的/意义】使用人工或常用软件工具获取本体概念及概念间关系已无法满足自媒体环境下大数据的本 体构建及维护的要求,本文尝试用自动或半自动方式予以实现。【方法/过程】对电子商务领域原始语料进行分句、 分词等预处理,构建领域语料库;使用基于语言学以及统计学的方法提取电子商务领域本体概念,同时提出基于混 合策略的本体概念抽取方法;然后使用基于语言学、聚类的方法提取电商领域本体概念与概念之间存在的分类关 系,使用基于关联规则挖掘的方法抽取其本体概念与概念之间存在的非分类关系。【结果/结论】将文本挖掘与本体 构建结合起来,提出了领域本体概念及概念间关系自动抽取与本体构建方法,实验表明使用本体框架 Jena利用此方 法可以自动构建电子商务领域本体,并可将其应用到通用的语义检索系统中。  相似文献   

5.
框架元素语义类型的确定对于增加本体的语义信息及其建立本体之间的映射具有重要作用.探讨了利用WordNet中词汇的丰富语义等级结构,自动确定框架元素语义类型的方法,提出了同义词扩展、上位词扩展的确定思路,并引入Wu-Palmer语义相似度算法,同时考虑WordNet及FrameNet不同的语义深度,以帮助有效地选择框架元素语义类型.  相似文献   

6.
利用本体扩展查询是语义检索的主流方向,如何构建完善的本体是亟待解决的问题,现对本体构建中概念及其同义关系的自动获取进行研究。每个概念用上下文特征词表示,利用完全加权关联规则挖掘概念集,将频繁项作为具有同义关系概念的特征词,包含这些频繁项的概念中的一个将作为本体概念。并规定概念的特征词权重量化表示,基于此对任意两个同义概念的相似度进行计算。实验表明该方法获取的同义概念精确度和计算效率高于半自动方式。  相似文献   

7.
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。  相似文献   

8.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

9.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

10.
为了提高文本聚类的质量和效率,本文提出了一种基于本体图的文本聚类模型。该模型一方面利用本体图表示文本,获取更多、更深的文本语义信息特征,提高文本表示的准确性;另一方面从语法结构和语义内容两个角度综合衡量文本间的相似程度,增强计算的精确性和全面性。实验结果表明,该模型明显优于现有的文本聚类模型,获得了很好的聚类效果,提高了文本聚类的质量和效率,降低了聚类的时间复杂度和空间复杂度。  相似文献   

11.
基于文本的本体学习方法研究   总被引:3,自引:1,他引:3  
梁健  王惠临 《情报理论与实践》2007,30(1):112-115,17
本文介绍了当前基于文本的本体学习主要方法,在种子概念的基础上,设计了一种基于文本的本体学习方法,同时分析了术语获取、概念分类、关系获取等基于文本的本体学习关键技术。实验表明,借助种子概念能够从纯文本中抽取概念,对概念进行分类,为本体开发提供基础。  相似文献   

12.
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。本文给出一个半自动化的需人工干预的本体学习体系结构,采用平衡的协作建模方式来构造语义Web中的本体;介绍了基于以上体系结构的本体学习的处理过程,并讨论了领域概念抽取,概念之间关系的抽取等关键技术。  相似文献   

13.
宗江琴  范荣 《科技广场》2007,41(5):31-33
近年来,本体学习技术逐渐成为计算机科学领域的一个研究热点,其重要性已在许多方面表现出来,如知识工程、数据库设计和集成、信息检索与获取、软件工程、自然语言处理等,尤其是本体论在Web上的应用导致了语义Web的诞生。本文的主要内容包括:本体论的起源和发展,粒计算研究的主要动机,粒计算的国内外研究现状,本体学习研究现状。  相似文献   

14.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

15.
[目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分政策内容进行标注并可视化。[结果/结论]该本体适用于科技创新政策文本的结构化语义抽取,能够在一定程度上揭示科技创新政策的结构化语义特征。  相似文献   

16.
通过对本体、形式概念分析等理论研究进行分析,提出一种以"文档——术语"为核心,形式概念分析为技术手段的气象灾害领域的本体构建方法。针对气象灾害领域知识库和主题词表的缺失,以中英文学术论文为数据源,对气象灾害领域术语的层次关系抽取和分析进行了详细阐述和论证,具体包括领域术语的抽取和筛选,文档术语矩阵的建立,主题概念格的生成,术语层次关系分析;本体OWL描述和可视化展示等过程,最后利用GATE Developer对构建本体的有效性进行了验证。  相似文献   

17.
研究的是在特定领域提取概念本体,以本题库作为知识管理的基础,再通过语义网OWL技术和本体技术对知识单元进行集成,通过构建敏感信息本题库,以本体和分布式技术为基础,通过语义推理来研究信息过滤系统。  相似文献   

18.
蔡皎洁  张玉峰 《现代情报》2013,33(5):105-111
鉴于领域本体开发缺乏统一化过程,本文拟提出一种基于软件工程开发的企业本体构建标准化流程,即用结构化开发方法将企业本体构建流程划分为规划、分析、设计、实施与运行5个阶段;具体在分析阶段,又利用原型化开发方法构建初始的企业本体概念框架,以在有限的时间内提高企业本体开发的质量。另外,实验中基于该流程构建了某企业手机产品本体,并比较了与基于"骨架法"流程所构建的相同领域本体在文本过滤应用中的效果。  相似文献   

19.
关于本体论的研究综述   总被引:3,自引:0,他引:3  
顾金睿  王芳 《情报科学》2007,25(6):949-956
本文是一篇关于本体论的综述性文章,介绍了本体的概念、本体的理论研究,包括本体的建模元语、分类、表示语言、构造规则以及目前研究本体的权威机构,对与本体相关的概念进行了介绍,分别探讨了本体与语义网络,本体与语义网,本体与叙词表的关系,最后介绍了本体在信息检索以及其他一些领域的应用。  相似文献   

20.
基于分众分类的本体构建分析   总被引:3,自引:1,他引:2  
传统的本体创建方法主要依靠小部分人的力量,在适应网络信息的动态性、复杂性上存在缺陷。Web2.0环境下流行的分众分类法能够为本体建立和演化提供丰富语料库和概念语义信息,从而为本体建立提供强大支持。本文利用社会网络分析的理论和方法,采用浮出语义的思路,分析基于分众分类的标引者—标签概念—实例三部图模型发掘概念间语义信息、建立本体的方法和过程模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号