首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 640 毫秒
1.
参考已有电子商务领域本体,本文提出一种基于用户兴趣本体学习的文本过滤模型.其中利用web挖掘技术构建带有权重的概念及概念间分类与非分类关系,以此基础上进行文本过滤,经验证,基于该本体的文本过滤质量有明显提高.  相似文献   

2.
对国内外面向文本的本体学习方法进行了综述,主要包括领域概念学习方法、概念间继承关系学习方法、属性关系学习方法、整体部分关系学习方法以及公理获取方法等各种本体学习方法的分析与评述.  相似文献   

3.
基于Web的中文本体学习研究   总被引:1,自引:0,他引:1  
介绍了国内外本体学习研究的现状,并在给出的本体形式化定义基础上,界定了本体学习的主要任务;探讨了通用本体学习系统体系结构设计的基本原则,提出了适于中文环境下基于Web本体学习的主要思路,包括多策略领域概念获取、基于分类目录和基于语境自学习的继承关系学习、基于知网的属性关系学习和基于本体的实例知识获取.  相似文献   

4.
本体是基于本体的信息检索性能优劣的关键。目前的本体学习没有专门针对信息检索的查询扩展和检索结果组织的特点,导致信息检索效果不佳。提出面向信息检索的本体学习框架,采用基于相容类的概念层次关系学习方法,各层领域概念从相容类对应的文档集合提取。然后量化表示领域概念,挖掘概念中的同义词,基于同义词重新建立文档集合的概念空间。将获取的本体应用到信息检索实验中,实验表明该框架获取的本体可提高检索的准确性和效率。  相似文献   

5.
将本体概念引入综合评价体系中,通过建立评价体系的本体框架模型对领域内评语进行分析与获取,形成形式化的本体实例,同时结合模糊推理与决策逻辑对获取的评语进行分类汇总,最终自动生成领域内的综合评价文本。  相似文献   

6.
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。本文给出一个半自动化的需人工干预的本体学习体系结构,采用平衡的协作建模方式来构造语义Web中的本体;介绍了基于以上体系结构的本体学习的处理过程,并讨论了领域概念抽取,概念之间关系的抽取等关键技术。  相似文献   

7.
及时准确地对舆情信息进行主题分类,不仅能实时了解舆情动态变化,还能为预判舆情发展趋势、舆论引导建立基础。本文提出一种基于本体和加权朴素贝叶斯的网络舆情主题分类方法,通过使用本体将领域知识和领域文本特征融入分类过程中。将该方法应用到动物卫生领域舆情主题分类中,分类结果精确度为0.9402,Marco_F1达到0.9339。通过与朴素贝叶斯(NB)和THUCTC两种方法的对比实验,证明本文提出的基于本体和加权朴素贝叶斯的分类方法有效且具有可行性,但是领域本体的概念、关系的完备程度会影响分类的效率。  相似文献   

8.
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法.该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法.基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量.考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序.实例验证了该方法的有效性.  相似文献   

9.
中文本体的自动获取与评估算法分析   总被引:6,自引:0,他引:6  
在下一代互联网,即语义网中,信息模式建立在本体描述之上。由于手工构建本体是一项工作量巨大并且繁杂的任务,因而,能否自动构建本体正逐渐成为语义网使用的关键性要素。在这样的背景下,本文对比和借鉴了国内外本体自动获取的方法和思路,将中文领域本体的提取划分为文本预处理、本体抽取和本体关系获取三个阶段。接着,本文讨论了这三个步骤所涉及的算法,包括基于统计模式对文本抽词、基于奇异值分解从词—文档矩阵中提取本体、基于语义相似度对本体进行聚类等。对于本体自动获取的效果评估,本文提出了利用计算手工和自动两种方式得到的本体相似度来进行衡量的思路。  相似文献   

10.
构建本体时获取概念方法研究   总被引:5,自引:0,他引:5  
论述了领域本体构建中本体概念获取的重要性,介绍了领域本体概念的获取方法,并且以食品安全领域本体构建为例对每种方法进行说明,最后对每种方法的适用性和本体概念具备的特征进行讨论,对于领域本体构建时概念的获取具有启发作用.  相似文献   

11.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

12.
通过对本体、形式概念分析等理论研究进行分析,提出一种以"文档——术语"为核心,形式概念分析为技术手段的气象灾害领域的本体构建方法。针对气象灾害领域知识库和主题词表的缺失,以中英文学术论文为数据源,对气象灾害领域术语的层次关系抽取和分析进行了详细阐述和论证,具体包括领域术语的抽取和筛选,文档术语矩阵的建立,主题概念格的生成,术语层次关系分析;本体OWL描述和可视化展示等过程,最后利用GATE Developer对构建本体的有效性进行了验证。  相似文献   

13.
[目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分政策内容进行标注并可视化。[结果/结论]该本体适用于科技创新政策文本的结构化语义抽取,能够在一定程度上揭示科技创新政策的结构化语义特征。  相似文献   

14.
用户兴趣本体弥补了基于关键词的用户兴趣模型不能从语义上表达用户兴趣的缺陷,但大多是利用领域本体来构建,很难反映用户多方面和潜在兴趣,并且构建领域本体也是一个难点。本文据此提出一种基于词汇同现的用户兴趣本体构建方法。根据网页浏览记录找到用户兴趣网页集,经过数据处理将其转换成用户兴趣文本集。以TFIDF为指标抽取概念,词汇同现统计提取概念间关系,运用无尺度K-中心点聚类算法对其调整,将有关联用户的本体合并得到多用户本体,该本体能在语义上更全面反映用户兴趣并发现潜在兴趣。  相似文献   

15.
何小琴 《现代情报》2012,32(8):45-48
采购联盟合作伙伴的选择是采购联盟成功的一个关键,而伙伴搜索是伙伴选择重要的第一步。本文将电子商务中采购联盟伙伴搜索问题转换为采购需求文本的语义匹配问题,介绍了一种基于领域本体和语义相似度的采购联盟伙伴搜索模型。该模型通过对采购需求文本概念向量的上位填充和语义相似度计算来量化采购需求的语义匹配程度。  相似文献   

16.
本文将聚类分析引入竞争情报分析之中,构建了基于领域本体的竞争情报聚类分析模型。该模型利用竞争情报领域本体指导文本语义分析和标注,抽取特征概念和概念间关系,实现语义层面的文本表示;针对传统的聚类分析算法无法进行深层次的聚类分析,设计了一种基于语义核函数的聚类分析算法进行挖掘分析,实现深层次的聚类分析。实验结果表明,该模型取得了很好的预期效果,显著提高了竞争情报分析的准确率和效率。  相似文献   

17.
企业信息系统建设和集成过程产生的复杂度很大程度上决定于系统业务模型的语义复杂度。建立企业业务系统的语义复杂度测度模型是有效控制复杂度攀升的关键。建立企业系统的同构本体结构及其形式化方法的相关定义、定理,给出语义复杂度定义和测度方法。与聚合体系结构方法建模的企业系统进行语义复杂度的比较分析。结果显示,基于同构本体结构的企业系统建模过程具有最低的语义复杂度,语义复杂度不随系统建模过程发生变化,并且调整系统规模和系统集成过程不产生新的信息熵。理论上证实同构本体结构很可能是企业系统建模的最优结构,研究成果为企业系统开发和建模提供理论方法的指导。  相似文献   

18.
一种基于本体的语义标引方法   总被引:4,自引:0,他引:4  
传统的采用主题词和关键词对文档进行标引的方法,由于不能提供语义推理而越来越不适合目前的网络环境。由于本体具有良好的概念层次结构和对逻辑推理的支持,在信息检索领域将有很大的应用价值。本文首先介绍本体的基本概念和领域本体的组成部分,然后提出了一种基于领域本体的语义标引方法,采用本体中的概念对文档进行语义层面的标引,为检索的智能推理提供基础。  相似文献   

19.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号